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Prefacio 


La psicología se encuentra en un constante estado de cambio, si no es que de 
agitada confusión. En un esfuerzo por comprender la vida mental, miles de 
psicólogos proponen continuamente nuevas perspectivas, ideas, fenómenos, re- 
sultados experimentales y métodos de investigación, y lo hacen a un ritmo atrope- 
lado. 

A menudo el profesional siente que se ahoga en un torrente de información y 
no sabe si se halla en el flujo principal o en una corriente secundaria; el estudiante 
que apenas empieza ignora por dónde entrar en el agua a en qué dirección nadar. En 
este caso, un método comprobado para reducir la excesiva información consiste en 
examinar la génesis de los principales puntos de vista, integrarlos y estudiar su 
desarroilo en el marco de la investigación actual. Así, la perspectiva histórica ofre. 
ce un esquema organizado para el estudiante y para el profesional, Muchas de las 
“grandes preguntas'' acerca de los fenómenos mentales han sido formuladas des- 
de hace mucho tiempo, y las respuestas que surgieron a la largo de la historia sirven 
de guía a las hipótesis contemporáneas. 

El objetivo de este texto es ayudar al estudiante en la comprensión de la teoría 
moderna del aprendizaje, de su contexto histórico y de sus antecedentes. Con 
este fin se reseñan las teorías del aprendizaje de las principales escuelas de la psi- 
cología: el conductismo, la Gestalt, el cognoscitivismo, el procesamiento de infor- 
mación, así como aquellas relacionadas con teóricos de la talla de Thorndike, Pav- 
lov, Guthrie, Hull, Tolman, Skinner y Estes. 

Cada teoría se expone en los términos de su contexto histórico y de los pro- 
blemas científicos con los que el teórico se enfrentaba. Al presentar la teoría se 
reseñan a grandes rasgos las evidencias experimentales más relevantes que la 
sustentan. Cada una de dichas teorías se examinará inicialmente desde una pers- 
pectiva armónica; sin embargo, cada capítulo concluye con una discusión crítica y 
una valoración de la evidencia que las apoya. 

El primer capitulo es una introducción a los antecedentes filosóficos de la psico- 
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logía; en él se comparan las teorías del empirismo y del racionalismo, con base en 
las cuales se organizan los siguientes capítulos. 

En la primera parte se presentan ejemplos de la metodología empirista: teorías 
del aprendizaje con una gran influencia del asociacionismo y del conductismo; se 
incluyen aquí capítulos acerca de Thorndike, Pavlov, Guthrie, Hull y los neohu- 
llianos, la tradición del aprendizaje verbal, Skinner, Estes y recientes desarrollos 
en la teoría de la conducta, Se prosigue con contrastantes ejemplos de teorías 
racionalistas: teorías del aprendizaje con fuerte influjo de las ideas referidas a la 
organización y la estructura cognoscitiva. Se presentan después capítulos acerca 
de la psicología de la Gestalt, la de Tolman y teorías del procesamiento de infor- 
mación, así como aspectos vinculados con los desarrollos más recientes de la psi- 
cología cognoscitivista. Luego de estas dos secciones básicas se abordan dos temas 
relacionados importantes: la neyrofisiología del aprendizaje y las aplicaciones de 
los principios de) aprendizaje a la educación y a la instrucción. Cada capítulo se ha 
revisado y puesto al día con el fin de mostrar la influencia de las posiciones histó- 
ricas en el conocimiento actual, y cómo las modernas investigaciones se funda- 
mentan en ideas anteriores. 

La adopción de un marco que puede sintetizarse como empirismo versus ra- 
cionalismo nos ha obligado a reconstruir la estructura y el enfoque de diversos 
capítulos. Así, el que aborda el estudio del funcionatismo se presenta como apren- 
dizaje asociativo humano (capítulo 6), con énfasis en sus puntos de vista acerca del apren- 
dizaje. El tema aparece en el primer conjunto de capítulos. ya que la tradición del 
aprendizaje verbal (el logro más acabado de esta escuela) siempre ha tenido un tin- 
te asociacionista, Como este libro se orienta más hacia los teóricos que hacia las 
propias teorías, el capítulo acerca de la teoría del aprendizaje matemático gira en 
torno de la obras de William Estes. Más allá de los esfuerzos de otros investigado- 
res que trabajan en la teoría del aprendizaje matemático, la teoría del muestreo 
de estímulo, de Estes, posee la coherencia y el alcance que le confieren el sello de 
una teoría global del aprendizaje, dentro de la tradición de Guthrie, Hul] y Tolman. 
Aunque en cada capítulo se mencionan importantes investigaciones recientes que 
sustentan la teoría, los dos que versan sobre avances actuales contienen reseñas 
de investigaciones relacionadas con temas generales y que han sido abordados por 
una clase de teorías (conductal versus cognoscitiva). Así, en el capítulo 9 se rese- 
han algunos desarrollos recientes en teorías conductuales, que incluyen los estu- 
dios acerca del control de retroalimentación de las respuestas involuntarias, teorías 
del condicionamiento pavloviano, del equilibrio del reforzamiento y la aplica- 
ción de las técnicas conductuales a problemas médicos y psiquiátricos. En el 
capítulo 13 se presentan trabajos recientes de la psicología cognoscitiva: teorías 
acerca de la memoria de corto plazo, profundidad del procesamiento, imaginación, 
memorias episódica, semántica y narrativa, así como aprendizaje social, El 
capítulo 15, que trata acerca de la educación, abarca técnicas de instrucción en la 
educación, sugeridas o apoyadas por la teoría del aprendizaje. Esperamos que el 
texto proporcione una base sólida para que el estudiante comprenda las modernas 
teorías del aprendizaje e incluso contribuya en sus aplicaciones. 

En esta edición no se inclayen capítulos dedicados a Piaget y a Freud, ya que 
una encuesta aplicada a maestros indicó que estas escuelas no resultan de gran 
utilidad en un curso clásico de teoría del aprendizaje. 

Este texto puede cumplir con propósitos educativos para curso específico y ade- 
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más proporcionar material de lectura para otros estudios universitarios. En espe- 
cial, es adecuado para desarrollar un curso acerca de la teoría del aprendizaje, de 
uno o dos periodos académicos. Varios capítulos son recomendables para estudiar 
la historia de la psicología (fundamentalmente los capítulos 1 a! 7 y 10 al 12). Los 
maestros que deseen destacar fenómenos o principios del condicionamiento y del 
aprendizaje animal podrán basar su programa en los capítulos 2 al 9, 11 y 14. Si se 
desea impartir un curso acerca de la memoria humana y el procesamiento cog- 
noscitivo de la información, el material pertinente se encontrará en los capítulos 1, 
6,8, 10, 12, 13 y 15. Así, la obra ofrece elementos que pueden emplearse con fle- 
xibihdad. Hacemos notar que durante muchos años este texto se ha citado y utili- 
zado más a menudo que cualquier otro en la elaboración de tesis de doctorado en 
filosofía y licenciatura en psicología. 

La revisión de un texto extenso es trabajo laborioso y por ello agradecemos la 
ayuda de las siguientes personas. En primer lugar la colaboración de Joyce Lock- 
wood, que realizó la mecanografía de los diversos borradores del manuscrito. El 
texto mejoró considerablemente gracias a las correcciones de Larry Barsalou (un 
estudiante graduado en psicología, de Stanford) y de Robert Monvy. La supervisión 
final del manuscrito en el proceso de impresión estuvo a cargo de Joyce Turner y 
John Isley. A todos ellos nuestro agradecimiento más sincero. 

G.H. B. 
E.R,H. 
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Naturaleza de la teoría 
del 


aprendizaje 


No es un secreto que la psicología se desarrolló a partir de la filosofía. Las pre- 
guntas realmente fascinantes de la psicología no fueron ““descubiertas'” par los 
psicólogos modernos; para los filósofos son cuestiones de profundo interés desde 
hace muchos siglos. La psicología filosófica surge del intento de entender la 
naturaleza del hombre; después, la psicología se independiza para convertirse en 
**la ciencia de la vida mental”*. Las interrogantes se plantean de esta forma: ¿qué 
son la mente, la conciencia y el conocimiento?, ¿cuál es la relación entre la mente 
y el cuerpo?; ¿cómo se desarrolla la mente a partir del nacimiento?; ¿de qué forma 
adquiere conocimientos acerca del mundo?; ¿cómo llega a conocer otras mentes y 
a conocerse a sí misma? ¿qué nos impulsa a la acción?; ¿qué es el yo?; ¿qué pro- 
duce la continuidad de la identidad personal? Estas y muchas otras preguntas pro- 
porcionan la base intelectual de la psicología moderna, 


MEMORIA Y CONOCIMIENTO 


Este es un libro que trata acerca del aprendizaje y de la memoria, áreas del co- 
nocimiento que constituyen subespecialidades de la psicología moderna. El estu- 
dio de estas materias se fundamenta en dos escuelas filosóficas: el análisis del 
conocimiento (cómo llegamos a conocer las cosas) y el análisis de la naturaleza y la 
organización de la vida mental. El primer tema de discusión es el que los filósofos 
denominan epistemología; es decir, la teoría del conocimiento. El segundo se re- 
fiere a la naturaleza del pensamiento e imaginación y al contenido de conceptos, 
imágenes, y recuerdos. Una pregunta ulterior que aquí se plantea se refiere a las 
operaciones, reglas o leyes que gobiernan estos fenómenos mentales. Ej estudio 
del aprendizaje podría muy bien denominarse epistemología experimental, ya que 
al parecer el aprendizaje y el conocimiento se relacionan de la misma manera que 
un proceso se vincula con sus resultados, una adquisición con una posesión, una 
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pintura con una fotografía, etc. La estrecha correspondencia entre los significados 
de abreniler, saber y conocer es obvia y se encuentra en cualquier diccionario; por 
ejemplo, en el American Heritage Dictionary:! 


aprender (verbo): 1. Obtener conocimiento, comprensión o maestría a través de la ex- 
periencia o del estudio. 2. Fijar en la mente u en la memoria; memorizar. 3. Adquirir a tra- 
vés de la experiencia. 4. Serinformado de, descubrir. 

saber o conocer (verbo): 1. Percibir directamente con los sentidos o con la mente; 
aprender con claridad o certidumbre. 2. Tener certeza de; aceptar como verdad más allá 
de toda duda. 3, Ser capaz de, tener la habilidad para hacer. *“Saber cómo” (know how) ha- 
oer algo. 4. Tener una comprensión práctica de alguna cosa mediante la experiencia. 5. 
Experimentar, estay sometido a. 6. Maber asegurado firmemente enla mente o en la me- 
moría. 7. Ser capaz de discernir, reconocer, distinguir. 8. Estar al corriente o 
famibarizado con. 


Aprender significa “obtener conocimientos a través de la experiencia”, y “ex- 
peniencia'* es “percibir directamente con los sentidos”, un significado que apa- 
rece en la definición de saber o conocer. Sin embargo, al conocimiento se lo define, 
entre otras cosas, como «aprendizaje (erudición) y como familiaridad o 
comprensión que se obtiene mediante la experiencia, mientras al aprendizaje se le 
entiende como conocimiento adquirido: nos encontramos en un círculo vicioso. 

Consideremos los otros dos términos, memoria y recuerdo, La memoria es la 
facultad de retener y revivir experiencias pasadas, o la habilidad de recordar; y el 
recuerdo, el acto de hacer volver una experiencia a la mente o pensar en ella de 
nuevo. Todo esto origina un grupo de conceptos interrelacionados. Más que eso, 
en nuestra conducta cotidiana la memoria (o recuerdo) es una de las formas pri- 
mordiales mediante Ja cual conocemos a las cosas y basamos nuestra demanda de 
Conocimientos. El valor que en los tribunales se otorga al testimonio de testigos 
presenciales prueba el evidente poder de persuasión de los recuerdos directos: 
**¿cómo sé que Juan robó ese dinero? Porque recuerdo haberlo visto con la mano 
puesta en el cajón”. La existencia de estos recuerdos constituye un argumento 
que avala ese conocimiento, a menos que otras consideraciones provoquen dudas. 
De hecho, una de las primeras aplicaciones del estudio de la memoria fue la de mi- 
nar su validez al apoyar demandas de conocimiento. Los estudios demostraron 
que muchos de los recuerdos de sucesos remotos dados en testimonio eran in- 
exactos, distorsionados, y subjetivamente prejuiciados, Estos errores se presentan 
con más probabilidad en recuerdos de crímenes, disputas o acontecimientos que 
poseen carga emocional. 


EPISTEMOLOGÍAS ALTERNATIVAS 


Entre los temas más atrayentes de la teoría del conocimiento se encuentran las 
interrogantes acerca de cómo surgen los conceptos y el conocimiento, y cuál es 
la relación entre experiencia y organización de la mente. El empirismo y el zacio- 


lLas definiciones corresponden a los verbos en inglés to learn y to kuow, respectivamente, (N, 
del E.). 
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nalismo sostienen puntos de vista opuestos en lo que a ellos se refiere. Desde 
hace siglos se enfrentan en la arena intelectual y aún en nuestros días, puede re- 
conocerse su influencia en la psicología **científica””. 


Empirismo 


El empiristmo sostiene que la experiencia es la única fuente del conocimiento. 
Otorga un estatus especial a la experiencia sensorial, aunque se infiera algún cono- 
cimiento de las reflexiones intelectuales acerca de las relaciones entre las expe- 
rencias. Nuestras ideas provienen de impresiones sensoriales, ya sea como copias 
directas de ellas (las denominadas ideas simples) o como combinaciones de diver- 
sas ideas simples o complejas. La impresión sensible de un objeto (por ejemplo, 
una naranja) puede descomponerse en cualidades sensoriales: sensaciones 
que corresponden a su color, olor, tamaño, textura, sabor, etcétera. Estas cuali- 
dades sensoriales se llegan a conectar (o se ““asocian””) en la mente porque se 
producen muy próximas en el tiempo o en el espacio cuando interactuamos con el 
objeto. La idea de una naranja es compleja, pero reducible a interasociaciones en- 
tre ideas más simples y primitivas. El ““conocimiento”” ulterior adquirido acerca 
de las naranjas puede expresarse al asociar este complejo de ideas con otras ideas 
relacionadas; por ejemplo, que las naranjas-son frutas y que son comestibles. 

El empirismo tiene las siguientes características: 

1. Sensualisnto, la hipótesis de que todo el conocimiento deriva de la experien 
cia sensible. 

2. Reduccionismo, que afirma que todas las ideas complejas se construyen a par- 
tir de un tronco básico de ideas simples, y que las ideas complejas son a su vez re- 
ducibles a estas ideas simples. 

3. Asociacionismo, tesis según la cual las ideas o los elementos mentales están 
conectados mediante la operación de la asociación de experiencias que suceden 
muy próximas en el tiempo (contigiiidad). 

4. Mecanicismo, que sostiene que la mente es como una máquina construida con 
elementos simples, sin componentes misteriosos. 

El empirismo implica dos mecanismos básicos del aprendizaje: 1. Represen- 
taciones internas de ideas simples (“imágenes de la memoria””) que se originan 
por el sólo copiar sus correspondientes impresiones sensoriales en el almacén de 
la memoria; y 2. Las ideas complejas se forman al conectar en la memoria ideas 
simples que se experimentan de modo contiguo y se vinculan por una relación aso- 
ciativa. El recuerdo de que al suceso A siguió de inmediato el suceso B, se regis- 
tra en la memoria como una asociación de la idea a a la idea b. En realidad, esto equi- 
vale a copiar en la memoria el hecho de la co- ocurrencia de los contenidos men- 
tales a y b. Tales asociaciones pueden registrar secuencias temporales o causales 
de sucesos, como raspar un fósforo-encenderlo-calor-fuego. Activar o revivir es- 
tas secuencias asociativas de la memoria constituye el supuesto método mediante 
el cual la mente se mueve de una idea a otra. Este método explica el orden de su- 
cesión en una cadena de ideas durante el pensamiento ocioso o el pensamiento di- 
rigido a un objetivo, Para ilustrar este último tipo de pensamiento, supóngase que 
el evento final en una cadena se convierte en una meta (**quiero comer un hela- 
do””). Entonces, pensar en ese objetivo llamará a la mente a un precursor inme- 
diato del mismo en el pasado ('“comprar helado en la tienda””), y éste a su vez 
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traerá a la mente lo que debe ocurrir primero para obtener lo deseado (**conseguir 
dinero e ira la tienda”), etcétera, 

Así, una cadena de ideas dirigidas por un objetivo puede desarrollarse hacia 
atrás, desde el efecto hasta la causa, para llegar a alguna acción que pueda ejecu- 
tarse ahora, y de este modo poner en marcha la secuencia cuidadosamente consi- 
derada. Las cadenas asociativas que reflejan secuencias causales se emplean de 
dos maneras básicas: avanzan hacia adelante desde a hacia 6 y c para predecir, an- 
ticipar o esperar sucesos futuros a partir del evento'o de la acción presentes; y co- 
rren hacia atrás, desde c a b hasta a para explicar por qué el evento e ocurrió, o 
para planear cómo provocar e. La predicción, explicación y planeación son habili- 
dades fundamentales mediante las cuales nos relacionamos con el mundo, y la teo- 
ría asociativa sugiere formas de hacerlo. 

En su teoría de la mente los empiristas incluyen la noción de ““reflexión””, según 
la cual se supone que la mente recupera de la memoria diversas ideas, las compara 
y extrae alguna conclusión que registraría como otra asociación. La idea de la re- 
flexión resultaba indispensable para explicar de qué modo obtenemos conocimien- 
to mediante la abstracción, la inferencia y la deducción. Al ““abstraer”' las propie- 
dades comunes y críticas de las diversas propiedades accidentales y no esenciales, 
formamos un concepto general de un tipo de cosa a partir de la experiencia, junto 
con un conjunto de sus más variados ejemplos. En la deducción, llevamos a la re- 
Dexión consciente una consecuencia lógica de otras cosas que conocemos; por 
ejemplo si sabemos que Beto es más alto que Juan y que Juan es más alto que Pe- 
dro, mediante la reflexión, la mente deduce (y almacena en la memoria) que Beto 
es más alto que Pedro. De acuerdo con la doctrina empirista, la reflexión es el úni- 
co mecanismo de que dispone la mente para liberarse a sí misma de ser un regis- 
tro totalmente pasivo de secuencias de impresiones sensoriales, 

Como explicaciones de los fenómenos mentales, el empirismo y el asociacionis- 
mo fueron elaborados en gran parte por filósofos como Thomas Hobbes, John 
Locke, David Hume, James Mill y Johxr Stuart Mill, Un desarrollo de particular in- 
terés se refiere a las leyes de formación de la asociación. Al presuponer que la 
contigilidad de los eventos experimentados es la condición necesaria y suficiente 
para la formación de asociaciones, los empiristas proponían que el grado de asocia- 
ción (o cantidad de memoria) variaría en proporción directa a lo vívido de la expe- 
riencia, su frecuencia, su duración y su recencia (cercanía en el tiempo) con la 
prueda de retención. Tales conjeturas han dado lugar a muchas' investigaciones 
experimentales acerca del aprendizaje y la memoria y, de un modo u otro, todas 
las teorías del aprendizaje manejan estos factores. 

El asociacionismo condujo a la investigación experimental del aprendizaje. Los 
primeros experimentos relacionados con la memoria humana, dirigidos por el cien- 
tífico alemán Hermann Ebbinghaus (1885), se emprendieron explícitamente para 
comprobar ciertos postulados de la doctrina asociacionista; la primera monografía 
experimenta) acerca del aprendizaje animal, debida a Edward Thorndike (1898), 
se titula Animal intelligence: An experimental study of the associative processes in 
antmals. 

Durante los últimos 70 años, los desarrollos dentro de las escuelas estadouni- 
denses de psicología casi no han alterado el enfoque asociacionista. Las teorías se 
tornaron más precisas, y se ha acumulado mucha más información detallada. Asi- 
mismo, los importantes papeles de la motivación, la recompensa y el castigo en el 
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aprendizaje y en la ejecución recibieron un tratamiento más sistemático del que 
fueran objeto en la tradición asociacionista clásica. La revolución conductista, diri- 
gida por John Watson, sustituyó las ideas e imágenes mentalistas de tiempos pasa- 
dos por los estímulos y las respuestas observables. Pero subsistió el tinte asocia- 
cionista del “mecanismo de adquisición” (o dispositivo de aprendizaje). Por lo 
tanto, el empirismo y el asociacionismo configuraron el molde en el cual se ha for- 
mado y cristalizado tal vez incluso solidificado la teoría contemporánea del aprendi- 
zaje. Desafortunadamente, parecen existir diversas grietas en la premisas del 
asostacionismo clásico, considerado ya sea como epistemología o coma un medio 
para Ja reconstrucción de los contenidos de la vida mental. Estas imperfecciones 
se hacen menos marcadas cuando se examina la posición epistemológica opuesta, 
el racionalismo. 


El racionalismo 


El racionalismo es la posición filosófica que sostiene que la razón constituye la 
principal fuente de conocimiento; antes que los datos de los sentidos, la autoridad, 
la revelación o la intuición, la razón es el único fundamento vábido del conocimien- 
to, la creencia y la acción, En sus obras, filósofos racionalistas como Descartes, 
Leibniz y Kant se enfrentan al empirismo casi en cualquier esquina. Los racionalis- 
tas tienen una perspectiva totalmente distinta acerca del papel que desempeñan 
los **datos sensibles”? en nuestra construcción de la realidad. Para el empirista, 
nuestras ideas son copias pasivas de tales datos; para el racionalista, los datos 
sensibles son un caos no estructurado e indiferenciado, y sólo proporcionan mate- 
rial en bruto para un mecanismo interpretativo que los considera como indicios 
acerca de su fuente y significado probables. Los datos sólo pueden interpretarse de 
acuerdo con ciertas formas; más exactamente, con arreglo a ciertas clases de pre- 
misas perceptuales innatas con las cuales la mente comienza. 

¿En qué consisten estas formas, estas premisas interpretativas? Diferentes 6- 
lósofos racionalistas han considerado distintas nociones como verdades *'paten- 
tes””. Un ejemplo de una premisa interpretativa es que los eventos siempre nos 
parecen incrustados en un marco de referencia espaciotemporal: los sucesos fí- 
sicos (e incluso muchas cosas que llamamos eventos mentales) ocurren en un mo- 
mento particular y en un espacio determinado, o, al menos, no podemos evitar 
interpretarlos de ese modo. Kant y Descartes pensaban que nuestro conoci- 
miento del espacio era sólo la proyección sobre el mundo de las “verdades pa- 
tentes”* de la geometría euclidiana con la cual nacieron. Kant rechazaba el intento 
empírico del arzobispo Berkeley, que consistía en derivar la percepción de la pro- 
fundidad (de objetos en tres dimensiones) y de las constancias perceptuales a par- 
tir de correlaciones empíricas entre las sensaciones sobre la retina bidimensional y 
el sentido del tacto; por ejemplo, alargar la mano hacia un objeto a la vista. Este 
tema todavía absorbe el interés de los psicólogos que estudian e! desarrollo per- 
ceptual (véanse T.G. R. Bower, 1965; F.). Gibson, 1969), y la evidencia reciente 
al parecer favorece la hipótesis “innata'” de la percepción de la profundidad. En 
otras palabras: pareciera que los recién nacidos ven los objetos en profundidad y 
perciben que un objeto es el mismo así se encuentre cerca o lejos de ellos, lo cual 
cambia su imagen sobre la retina. 
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Organización perceptual 


Una crítica genera) que los racionalistas han dirigido al empirismo clásico es que 
la teoría empírica de la percepción brinda una explicación inadecuada del carácter 
unitario de las percepciones y del papel que desempeñan hs relaciones en la crea- 
ción de las unidades perceptuales. Los racionalistas aárman que las relaciones 
entre los puntos de sensación elemental son tan primarias y psicológicamente vívi- 
das como los mismos puntos de sensación; no escuchamos una serie de tonos sino 
una melodía coherente; no vemos una brillantez particular sino el radio de los re- 
flejos entre un punto y su entorno; no vernos imágenes sucesivas de un objeto que 
cambia de localización sino su ''movimiento continuo'” a través del espacio visual. 
El color de un objeto se **adhiere”” a su superficie como propiedad inalienable de 
una unidad: no vemos “'rojo'” y “*manzana'”, sino la unidad de “una manzana 
roja”*, La psicología de la Gestalt, que examinaremos en el capítulo 10, se inició 
como una rebelión contra los análisis atomicistas y reduccionistas de ja expentencia 
perceptual que proporcionaba el empirismo clásico. Los gestaltistas suponían que 
la experiencia perceptual revelaba propiedades '“emergentes”* (por ejemplo, mo- 
viniento aparente) que no derivan de combinaciones de las propiedades de sus 
elementos (por ejemplo, secuencias de vistas fijas), Se postulaba que bas percep- 
ciones se organizaban de acuerdo con ciertas leyes de segmentación, agrupamien- 
to relacional, y simplicidad; que los procesos perceptuales seleccionaban “formas 
buenas”' e imponían tales organizaciones e interpretaciones sobre la ''sustancia”' 
caótica o amorfa, para emplear el término de Kant. 

De acuerdo con Kant, un ejemplo de presuposición innata de la mente es la no- 
ción de la causalidad de los sucesos en el tiempo y en el espacio. El empinsta Da- 
vid Hume ya había planteado su escepticismo acerca del concepto de causalidad, al 
argumentar que '“el suceso 4 causa al 4” se reducía en lo esencial a *'A es 
seguido invariablemente por B”*. Por el contrario, Kant argumentó que la causa- 
lidad era una experiencia tan básica o perceprualmente primitiva como la sucesión 
temporal. Los racionalistas creían que la mente estaba prefijada para “proyectar” 
causalidad dentro de muestras interpretaciones de eventos sucesivos en el mundo. 

Experimentos realizados por Michotte (1954) y otros sugieren que las personas 
están sumamente prejuiciadas para adscribir causalidad a los sucesos perceptuales 
relacionados en formas cuidadosamente especificadas. Por ejemplo, si ven una 
película cinematográfica en la cual aparece una bola roja que se mueve de izquier- 
da a derecha y toca a una pelota negra inmóvil, que entonces se desplaza de izquierda 
a derecha hasta satir de la pantala, no perciben que los dos objetos se muevas in- 
dependiente. Más bien tienen una poderosa experiencia de causalidad. de la pelota 
roja *“que choca y pone en movimiento”' a la negra. La percepción depende esen- 
cialmente de la coordinación temporal de los movimientos iniciales de las bolas roja 
y negra, y la correspondencia de sus dos trayectorias. Dependiendo de estos fac- 
tores, los sujetos ven que la bola roja pone en movimiento a la negra, o que la en- 
cuentra y la impulsa, o la persigue, o se mueve de manera autónoma. Tales expe- 
rimentos sugieren que los juicios perceptuales de causalidad son tan inmediatos y 
están tan bien sintonizados como los juicios acerca de la brillantez o del color. Es- 
tos temas se aclararán cuando se examine la teoría de la Gestalt, pero lo impor- 
tante a destacar aquí es que la psicología de la Gestalt se inicia como una rama del 
racionalismo filosófico. 
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La organización mental 


Como veremos más adelante, el racionalismo fue bastante afortunado en su ata- 
que a la doctrina del asociacionismo (Anderson y Bower, 1973; DeGroot, 1965; 
Duncker, 1945; Mandler y Mandler, 1964). Por un lado, es evidente que las “'aso- 
ciaciones”” entre ideas llevan consigo información acerca del tipo de relación impli- 
cada. Por ejemplo, en nuestra mente un restaurante está asociado con la comida, 
un glotón con la comida, un tenedor con la comida, y un filete con la comida. Pero 
el “vínculo asociativo” simple de la doctrina clásica no explica nuestro conocimien- 
to de que ¡a relación entre el primer par de ideas es el de la localización con la ac- 
ción, e) segundo par el del actor con la acción, el tercero del instrusrento con la 
acción, y el cuarto del objeto con la acción. La mente requiere de una representa- 
ción de) conocimiento a partir de la cual las ideas interasociadas se clasifican de 
acuerdo con su tipo de relación; por ejemplo, ese animal se clasifica como un su- 
pernominal de pájaro, ese canario es un subnominal de pájaro, esas alas o plumas 
son propiedades de los pájaros, y el hecho de que cante o vuele son acciones posi- 
bles de los pájaros, Esta clasificación parece necesaria a fin de dirigir búsquedas 
eficientes a través de la memoria, de información que cumpla con ciertos requi- 
sitos básicos. Por ejeraplo, no está claro el modo en que el aparato mental del aso- 
ciacionista contestaría alguna pregunta del tipo: ““¿Qué relación tiene R con el 
concepto X?”* (verbigracia, ''¿cuál es un ejemplo de pájaro?””). Si las asociaciones 
están marcadas con clasificaciones relacionales, entonces son posibles las búsque- 
das y las recuperaciones restringidas. La manera en que usamos asociaciones 
puede estar determinada pot las instrucciones que estipulen metas generales 
("Déme la asociación opuesta de cada palabra: arriba-abajo, izquierda-derecha, 
alo-bajo...”*); después de poco tiempo, estas ““tendencias determinantes'' se 
vuelven inconscientes y dirigen automáticamente el proceso asociativo cuando 
opera sobre las palabras estímulo (considerando lo pesado cuando se habla de lo li- 
gero, por ejemplo). La doctrina asociacionista clásica carece de la forma de repre- 
sentar la influencia de estas determinantes tendencias selectivas. 

A la teoría asociativa de la mente se le ha criticado además porque no logra ex- 
Pliicar cómo impone la mente una estructura sobre los datos perceptuales (senso- 
riales) entrantes. Es decir, la teoría no proporciona ninguna restricción o liti- 
tación acerca de qué podría asociarse con qué; no establece principios inherentes 
para determinar la *“pertenencia'* de casos de experiencia (en el capítulo 2 véase 
la opinión de Thorndike relativa a la ““pertenencia'”), ninguna restricción acerca de 
“la buena formación”? de las estructuras de entrada. Los racionalistas argumenta- 
ban que la ““experiencía bruta”, junto con los principios del aprendizaje asociativo, 
no bastan para prevenir la acumulación de una masa desorganizada de caprichos 
accidentales que se hunden en un caos de agobiantes aspectos particulares. Más 
bien deberían imponerse ciertas '*restricciones”” (como formas o principios inna- 
tos) a la interpretación de sucesos; la mente humana sólo acepta hipótesis de for- 
mas Particulares. 


Adquisición del lenguaje: 1n ejemplo racionalista 


La hipótesis de las restricciones innatas se presenta con mayor vigor en ciertas 
descripciones modernas de la manera en que los niños adquieren el lenguaje. Lin- 
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giiistas como Chomsky (1972), Lenneberg (1967) y McNeil (1970) argumentan 
que las premisas empiristas son inadecuadas en principio para explicar el aprendi- 
zaje de la competencia lingúística mostrada por cualquier hablante nativo, La per- 
sona que aprende una lengua debe asimilar un conjunto sumamente complejo y 
abstracto de reglas para la transformación de líneas de sonidos discursivos en signi- 
ficados, y viceversa. Los modernos análisis de la competencia lingúística ilustran 
lo abstractas que son las reglas gramaticales que los niños ejemplifican en sus en- 
frentamientos con el lenguaje: juzgan si las expresiones son gramaticales, si no 
son ambiguas, y si dos oraciones significan lo mismo. El problema para el empiris- 
ta es que esta competencia lingiiística abstracta y compleja parece ser algo que to- 
dos los niños aprenden de modo más o menos uniforme casi a la misma edad con 
una variación relativamente pequeña (ignorando los dialectos). El problema se 
complica por el hecho de que los registros de vocalizaciones que los adultos diri- 
gen a niños preverbales revelan múltiples interrupciones, deslices, errores gra- 
maticales, expresiones fragmentadas, titubeos, oraciones pronunciadas a medias 
y locuciones sin sentido, En suma, desde un punto de vista gramatical, la entrada 
del habla para los niños preverbales es jerga ruidosa. Además, en tanto en- 
trenador el padre tiende a reaccionar ante las vocalizaciones del niño de acuerdo 
con la intención de éstas, el uso, o la verdad o falsedad, en vez de considerar sus 
aproximaciones a una buena gramática. Una escena típica es esta: “¿Papi fue tien- 
da?””, “No, fue a la oficina”; “¿papi oficina?” “'sí, eso es: papi oficina'”. Estos 
diálogos no son Jos óptimos para que el niño aprenda las reglas gramaticales. 

Lo paradójico es cómo nuestra competencia lingiiística —que al parecer está go- 
bernada por este conjunto abstracto de reglas gramaticales— llega a formarse a 
partir de esas entradas verbales tan caóticas. Al rechazar las explicaciones empi- 
ristas, Chomsky (1972) argumenta que el niño dehe comenzar a vivir armado des- 
de el nacimiento con un pequeño conjunto de universales lingdísticos: es decir, con 
algunos conceptos básicos y principios fundamentales. Ejemplos de conceptos bá- 
sicos serían los veintitantos caracteres distintivos de los sonidos del lenguaje (véa- 
se Jakobson ef al., 1963), con los cuales todos los idiomas conocidos componen 
sus vocabularios; o los conceptos gramaticales de sujeto y predicado. Ejemplos de 
principios serían aquellos que distinguen la estructura lógica profunda de una ex- 
presión, de su forma superficial fonológica o sonora (para un examen de estos tér- 
minos, véase Chomsky, 1972). En todos los idiomas naturales estudiados hasta la 
fecha se encuentran componentes conceptos y reglas— similares, que parecen 
ser universales en el lenguaje humano. La teoría establece que estos principios 
abstractos de gramática universal son parte del equipo innato del niño, ya que pro- 
porcionan un esquema interpretativo al cual debe ajustarse cualquier lenguaje par» 
ticular, Chomsky desarrolla este argumento de la siguiente manera: 


.. al parecer el conocimiento de un lenguaje, una gramática, sólo puede ser adquirido 
por un organismo que está ““prefijado'* con una restricción severa en la forma gramati- 
tical, Esta restricción innata es una condición previa, en el sentido kantiano, para la expe- 
nencia lingúística, y aparentemente es el factor crítico que determina el curso y el resul- 
tado del aprendizaje del lenguaje. En el momento de nacer el niño no sabe qué lenguaje va 
a aprender, pero debe saber que su gramática tendrá una forma determinada de antemano 
que excluye a muchos lenguajes imaginables. Al seleccionar una hipótesis permisible, 
puede usar evidencia inductiva para la acción correctiva, confirmando o no su elección. 
Una vez que la hipótesis esté confirmada, el niño conoce el lenguaje que esta hipótesis de- 
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fine; por lo tanto, su conocimiento se extiende mucho más allá de su experiencia y, de he- 
cho, lo lleva a caracterizar gran parte de los datos de la experiencia coro defectuosos y 
desviados (1972, pág. 91). 


Chomsky propone que la metáfora de orientación para la adquisición del lenguaje 
no debe ser el aprendizaje sino la maduración, como sucede con el desarrollo em- 
brional de los órganos de los sentidos y de las extremidades bajo la guía de los códi- 
gos genéticos DNA dentro del embrión. El **aparato discursivo” del niño se desarro- 
lla con los sucesos desencadenadores apropiados y la exposición a una comunidad 
lingúística, así como cualquier órgano biológico requiere de un ambiente adecuado 
para su desarrollo, 

Chomsky no afina haber descubierto un conjunto completo de universa- 
les lingúísticos (Greenberg, 1962), o haber proporcionado los detalles acerca de la 
manera en que se formulan las hipótesis lingúísticas específicas (¿en qué lengua- 
je?) y se someten a prueba, Sin embargo, argumenta que ese marco de referencia 
tiene muchas más probabilidades de incrementar nuestra comprensión de la adqui- 
sición del lenguaje que la interpretación empirista asociacionista, que el propio 
Chomsky y otros lingúistas consideran sencillamente falsa, 


Comentarios finales acerca del racionalismo 


De este modo, tenemos ejemplos específicos de racionalismo y de su gran po- 
der de persuación, Como Kant (1781, pág. 1) afirmaba: “Aunque todo conoci- 
miento comienza con nuestra experiencia, de aquí no se deduce que su totalidad se 
origine en la experiencia”. Para el verdadero conocimiento es necesario presu- 
poner un marco de referencia seguro de relaciones de pensamiento, por encima 
de los datos sensoriales sin elaborar. El lector puede preguntar: ¿cómo llegó la 
mente a adquirir estas estructuras innatas que le atribuimos? A lo que podría con- 
testarse: mediante la “selección natural”, bajo la premisa de que la mente es 
como es porque ayuda al individuo a adaptarse al mundo real (al haberse eliminado 
durante la evolución biológica otros equipos innatos menos afortunados). O se 
puede responder, en un nivel más profundo, que los procesos exactos mediante 
los cuales se desarrolla la organización innata del organismo humano todavía son 
un misterio, 


Racionalismo, empirismo y la moderna teoría del aprendizaje 


La discusión anterior acerca del empirismo y el racionalismo proporciona algu- 
nas bases para comparar las modernas teorías del aprendizaje. Todas las teorías 
conductistas también son asociacionistas: se incluyen aquí las de Thorndike, Pavlov, 
Guthrie, Hull, Skinner y la corriente funcionalista. Estas escuelas se desarro- 
llan a partir de la combinación del asociacionismo con el hedonismo.? La psico- 


2Duranie los siglos XVI y XVIN se pensó mucho en los intereses, los valores y las motivaciones humanas 
como razones para la acción. Esta tendencia se relaciona con los desarrollos en la teoría de la utilidad (véan- 
se Bernoddli, 1738 y Bentham, 1789), que amplizha la doctrina del hedonismo. El hedonismo añrma que 
cada individuo está motivado por el deseo de placeres y por la aversión al dolor y a las privaciones, Las 
teorías modernas del aprendizaje, corno la de Hull (capítulo 5), pueden considerarse resultados de las tra- 
diciones mntelecwales del asociacionismo y del hedonismo, 
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logía de la Gestalt y los enfoques más novedosos del procesamiento de la infor- 
mación en psicología se ubican claramente en el extremo racionalista del espectro, 
La rama de la psicología cognoscitivista de Tolman se encuentra a medio camino 
entre diversas cuestiones importantes. La psicología matemática, por lo menos la 
teoría del muestreo de estímulo, es asociacionista, aunque nada haya inherente al 
uso de teorías cuantitativas que requiera de esa orientación. 

Volvamos ahora al tema de este capítulo —el aprendizaje— y veamos algunas 
distinciones importantes que se han puntualizado en torno de este concepto. La 
formación de conceptos en la ciencia avanza al establecer diferencias y clasificar 
casos, y lo mismo sucede con el concepto del aprendizaje, 


CARACTERIZACIÓN DEL APRENDIZAJE 


Como hemos dicho, el aprendizaje se relaciona a menudo con la adquisición de 
conocimientos, y la adquisición alude a un cambio referido a *'posesión””, En un 
tiempo, el organismo no '*poseía'” una pizca (b1!) de conocimiento, más adelante, 
sílo tuvo, ¿Cuál fue la causa de esa adquisición? Algo ha de sucederle al organismo 
para que cambie su estado de conocimiento. Generalmente suponemos que tuvo 
alguna experiencia especifica que provocó el cambio en su estado de conocimiento 
o guardó alguna relación con él, O el mundo le introdujo alguna información senso- 
ria), o tal vez el organismo intentó alguna acción y observó las consecuencias. O 
quizá consideró cuidadosamente la prueba de un teorema geométrico o cualquier 
otro evento. y 

¿Cuál es la naturaleza del conocimiento que el organismo adquiere? Esta es muy 
variada: tan variada como múltiples son las formas de conocer y los distintos conteni- 
dos a conocer. El conocimiento más sencillo en la memoria de cualquier persona es 
sólo un “registro de suceso” biográfico: un suceso con una descripción particular me 
ocurrió en tal fecha y en tal lugar. Esto se expresa a menudo como almacenamien- 
to de una **copia”” de experiencias sensoriales, una metáfora tan antigua que hasta 
platón la usaba, Un problema (entre otros) con la teoría de la copia o “imagen” de 
la memoria es que al recordar una escena, la persona suele verse a sí misma como 
un actor en ella; lo cual, desde luego puede no ser la expresión sensorial que expe- 
rimentó en tal ocasión. Acaso sea mejor decir que el organismo puede concebirse 
como “'si almacenara una descripción”” del suceso ocurrido. Los eventos típicos 
serían: '“mi perro Tobi mordio al cartero”*, “Enrique besó a Ana”, o “el expe- 
rimentador me presentó la palabra lápiz”, En el mundo de la fábula, el perro de 
Pavlov se decía a sí mismo: '*Después de la campana recibí comida””; y el axón gi- 
gantesco de un calamar en una mesa de disección podría declarar: ““a la irritación 
de mi terminación nerviosa sigue una desagradable descarga””. Supóngase que ta- 
les descripciones de eventos a secuencias de eventos se almacenan en la memo- 
na: aunque no son manifestaciones profundas de sabiduría, constituyen pizcas 
(bits) de Conocimiento que un organismo tiene acerca de su mundo. 

De modo que la experiencia causa un cambio en el conocimiento de! organismo, 
¿Siempre cambia? No, no siempre: sabemos que el organismo pudo haber dejado 
de aprender por diversas razones; tal vez no prestaba atención cuando ocurrió el 
evento. Por esto quizá nos convenga flexibilizar las condiciones y decir que la ex- 
periencia puede causar (probablemente cause) tin cambio en el estado del conoci- 
miento. 


Caracterización del aprendizaje 21 


Pero Tomás el incrédulo pregunta: *'¿Cómo sabes que tu sujeto ha cambiado su 
estado de conocimiento?”” Buena pregunta: ¿cómo puede usted decir lo que al- 
guien conoce? Bien, usted podría preguntarle a esa persona: *'¿le importaría de- 
cimos lo que sabe?” Si el sujeto es un catedrático universitario, su contestación 
insumirá mucho ticmpo (tal vez para la próxima semana usted haya olvidado cuál 
era la pregunta); si se trata del axón gigantesco de un calamar, la respuesta será 
un silencio de muerte, La pregunta estaba pobremente estructurada: usted más 
bien quiere saber si el conocimiento que tiene el sujeto acerca de un evento 
específico ha cambiado como resultado de una experiencia específica. De modo que 
usted intenta configurar preguntas específicas, o como decimos los psicólogos, 
“indicios de recuperación'” específicos. Usted preguntaría: ““¿qué hizo Tobj?”, 
*'¿quién besó a Ana?” “¿qué palabra le presentó el investigador hace unos mo- 
mentos?””, “¿qué suceso sigue al sonido de la campana?”', “¿qué sigue a la irrita- 
ción del axón?”” 

Después de formular la pregunta, usted espera que el sujeto responda. ¿Qué 
forma tiene la respuesta? El o ella responde: ella dice algo, él inclina la cabeza, ella 
se moja los labios, o se genera un potencial sináptico. Pregunta, contestación; es- 
timulo, respuesta. De la respuesta inferirros si el sujeto tiene o no disponible la in- 
formación especifica de interés o, al menos, descubrimos si nuestra pregunta tiene 
acceso a esa información almacenada. La palabra inferir está bien aplicada; el que 
alguien posea o no una pizca (Dit) de información no queda garantizado de modo 
uniforme ni porque nosotros le presentemos esa información, ni porque el sujeto 
diga que la conoce (puede mentir o estar equivocado, o tal vez no comprendió la 
pregunta), De manera que inferimos el conocimiento que alguien posee a partir de 
las entradas que tiene y de su salida de información, e inferimos el aprendizaje ori- 
ginado por una experiencia debido a los cambios de antes-a-después en su cono- 
cimiento inferido, 

Nuestra discusión se resume con la secuencia de eventos que aparecen en el 
cuadro 1,1, Aquí se aíslan los eventos importantes dentro de un solo episodio de 
aprendizaje (denominado ensayo), que va desde una posible prueba preparatoria 
mediante la presentación de la información a recordar, y formación de huella (o ad- 
quisición) — a través de la retención— hasta la recuperación y utilización de l in- 
formación almacenada. Nos refirimos a la huella de memoria como cualquier cosa 
que sea la representación interna de la información específica almacenada en el 
tiempo 2 del cuadro 1.1. La experiencia y el nuevo conocimiento establecidos en 
los tiempos 2 y 3 usualmente se clasifican como percepción, mientras que la memo- 
ria o retención de la información percibida se comprueba después del intervalo de 
retención que se extiende desde el tiempo 3 al tiempo n. En diferentes experl- 
mentos este intervalo varía desde unos pocas segundos hasta algunos años; cuan- 
do se hace variar el intervalo, estudiamos el o/rido. ¿Qué es el olvido? Sencilla- 
mente, consiste en que usted no recuerde algo en una prueba, cuando tenemos 
rezones para creer que conocía la información. Podemos presentarle al sujeto 
otros eventos diferentes (se dice que están interpolados) durante el intervalo de 
retención del tiempo 3 al tiempo «, silos variamos y observamos cómo se afecta 
la retención de punto central original, se dice que estudiamos los efectos de ¿nter- 
ferercia sobre la retención. 

En el tiempo x + ) sometemos a prueba la retención del sujeto al presentar una 
o más claves de recuperación, las cuales actúan como preguntas cuyo propósito 
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CUADRO 1.1 Diagrama de flujo de los eventos importantes dentro de un episodio 
de aprendizaje (“ensayo”) y estados inferidos del conocimiento del 
sujeto. Los términos situados a la derecha son los rótulos que los 
psicólogos emplean para referirse a los procesos que teóricamente 
ocurren en momentos particulares durante esta secuencia. S y E 
se refieren al sujeto y al ambiente (o experimentador), 
respectivamente. 


Tiempo Estados y eventos inferidos ; Rótulos del psicólogo 
0 Estado previo de conocimiento del $ j Prueba preliminar 
1 E presenta el evento Xa $ 
2 S experimenta el evento X Formación de huella 
, [adquisición) 
3 Nuevo estado de conocimiento de 5 
. 
» 
A Retención de huella 
n Estado “alterado”” de conocimiento de $ 
n+1 E presenta Ja clave a) $ para comprobar E 
p A A E Recuperación de huella 
el conocimiento de $5 : 
n+2 S responde o contesta ¿+ Utilización de la huella 


consiste en evaluar lo que el sujeto sabe acerca del suceso central. La recupera- 
ción de la hucila es el proceso mediante el cual la clave de prueba obtiene acceso a 
la información que el sujeto ha almacenado sobre un punto central dado. La clave 
de prueba se suministra de diversas formas; incluso puede alterarse sistemática- 
mente a partir de la clave *natural'* de la información central. En el nivel más sen- 
cillo, podemos pedirle a un sujeto que describa o nombre el evento que ha de re- 
cordarse, o que reconozca su recurrencia, A un nivel más complejo, por ejemplo 
con material de carácter proposicional, podemos pedir paráfrasis significativas de 
la proposición aprendida, para usarlas en un argumento, o cualquiera de entre va- 
rías otras ““conductas'' que tomemos como ejemplo de la comprensión de un enunciado. 

AJ sujeto podemos presentarle la misma información en reiteradas ocasiones, y 
él o ella puede practicar el recordarlas muchas veces. Las repeticiones conse- 
cutivas del mismo evento se separan generalmente por varios minutos y/o por 
presentaciones de otra información que ha de aprenderse. El aprendizaje se refie- 
re al cambio general en el conocimiento que posea el sujeto desde el tiempo cero 
en el primer ensayo hasta el tiempo » en el último ensayo del experimento, 
Algunos experimentos de condicionamiento elemental con animales usan cientos 
de ensayos, en cada uno de los cuales ocurren dos sucesos en contigitidad tempo- 
ral (por ejemplo, el sonido de una campana para el perro de Pavlov, y después el 
alimento que se le coloca en el hocico). Por supuesto, en tales experimentos el ín- 
vestigador mide alguna respuesta (como la cantidad de saliva) que se da por la cla- 
ve de recuperación (la campana). Esta respuesta se considera un índice del cono- 
cimiento que tenga el animal acerca del orden temporal de eventos (el hecho de 
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que después de la campana reciba comida). Los conductistas no describirían las 
cosas de esta manera: dirían que es la respuesta misma la que se relaciona con la 
campana y no algún conocimiento acerca del orden temporal de los eventos. Pero 
este punto se discutirá más adelante. 

El texto que aparece en el cuadro 1.1 proporciona una caracterización preli- 
minar de los eventos de aprendizaje y la terminología de los mismos. Pero en rea- 
lidad la caracterización es incompleta, porque hay otras actividades de aprendizaje 
que la descripción presentada en el cuadro no incluye. Las actividades ausentes 
son las que se refieren al aprendizaje de habilidades: habilidades perceptomoto- 
ras, así como intelectuales. Ejemplos de habilidades son escribir a máquina, nadar, 
montar en bicicleta, tocar el piano, lavarse los dientes, multiplicar números de dos 
dígitos con rapidez, etcétera. La mayor parte de las actividades en que está impli- 
cada la habilidad constituye un vasto conjunto de respuestas componentes interre- 
lacionadas. (Al escribir a máquina, por ejemplo, la visión de la letra M en el papel 
se traduce en el acto de oprimir una tecla particular.) Cabe suponer que la práctica 
proporciona información retroalimentadora para la totalidad de estos componen» 
tes. En el caso de las hahilidades, describimos el conocimiento de la persona (o del 
animal) en términos de que ella sabe cómo hacer algo, en lugar de referirnos a que 
es capaz de detallamos los sucesos. El recuerdo se ejemplifica en la ejecución. In- 
cluso nuestro vocabulario común para describir el aprendizaje de una habilidad di- 
fiere del que empleamos para el “aprendizaje de hechos”* del cuadro 1.1: no hay 
ninguna “información central” que recordar, sino más bien una secuencia de mo- 
vimientos coordinados, por lo general realizados frente a algún estímulo y ejecu- 
tados apropiada o pobremente. 


Una posible definición del aprendizaje 


Para regresar a nuestro problema inicial en torno de la caracterización del 
aprendizaje, los investigadores que tratan con animales o con seres humanos no 
verbales necesitan algún tipo de definición útil del aprendizaje, que no requiera de 
instrucciones, preguntas y respuestas verbales. Obviamente, tienen que observar 
alguna clase de conducta abierta en el sujeto, de preferencia aquella que consti- 
tuya un índice especifico del aprendizaje. Integrar una definición de esta naturaleza 
es difícil, pero la siguiente puede resultar de mucha utilidad. 

El aprendizaje se refiere al cambio en la conducta o en el potencial de conducta de 
un sujeto en una situación dada como producto de sus repetidas experiencias en esa 
situación, siempre que el cambio conductual no pueda explicarse con base en sus ten- 
dencias de respuesta innatas, su maduración, o estados temporales (como la fatiga, 
la intoxicación alcohólica, los impulsos, etcétera). 

La definición permite efectuar una inferencia acerca del “aprendizaje” sólo 
cuando no pueda plantearse un argumento para otra explicación. No establece 
condiciones suficientes para el aprendizaje, ya que algunos casos de experiencia 
reiterada con una situación no producen variaciones observables en la respuesta. 
Consideremos algunos cambios conductuales que esta definición provisional excluye. 


Tendencias de respuesta innata versus aprendizaje 


Los primeros teóricos de la psicología comparativa intentaron catalogar y cla- 
sificar las actividades innatas ('*no aprendidas””) dentro de los reflejos (como la 
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contracción de la pupila a la luz), taxias (como la polilla que vuela hacia la llama), e 
instintos (como el que tienen los pájaros de construir un nido). Tales actividades 
son características de varias especies, y las que son más idiosincráticas de una de 
ellas se llaman actividades específicas de la especie. 

Se dice que esta conducta específica es innata, lo cual significa que su forma se 
establece en el sistema nervioso de todos loz miembros de la especie, indepen- 
diente de ciertas formas de la experiencia. Pero resulta muy dificil clasificar con- 
ductas como totalmente innatas o totalmente aprendidas, Descubrimos que la ex- 
presión de muchos comportamientos instintivos depende de la experiencia o del 
aprendizaje (Hinde, 1966). Por ejemplo, el desarrollo y la expresión de la conducta 
sexual o maternal en los simios depende en mucho de que el mono pequeño tenga 
contactos “normales ”” con su madre y oportunidades *“normales”” de jugar con 
compañeros de su edad (Harlow y Harlow, 1966; Sackett, 1967). El desarrollo del 
canto característico de muchas especies de pájaros depende de que el polluelo la 
escuche desde el comienzo de su existencia (Marler, 1970; Nottebohm, 1970). 
Por ejemplo, el desarrollo del canto del pinzón o del gorrión de cresta blanca pare- 
ce ser el siguiente: durante la primera primavera de vida, el macho joven debe ser 
expuesto al canto de los machos de su especie, aunque el polluelo no cante du- 
rante esta época. En la estación del apareamiento al año siguiente, el pájaro joven 
(incluso si ahora permanece en aislamiento) empieza a cantar. Su canto inicial es 
deficiente en calidad y en fraseo; sin embargo, se reconoce como el dialecto musi- 
cal de los machos de su especie, Un aspecto secundario notable es que, sólo yra- 
cias a la práctica, además de escucharse a sí mismo, el pájaro joven finalmente 
realizará una eficiente reproducción del canto de los de mayor edad. El enigma es 
cómo puede este pájaro, en aislamiento total, mejorar su ejecución frente al mo- 
delo que escuchó un año antes. Debemos suponer que se produce algo así como 
un registro de memoria de un canto seleccionado genéticamente, y que el registro 
almacenado sirve al año siguiente como un patrón y un '“tutor interior”' que corri- 
ge las producciones del pájaro joven. ¡Qué logro tan sorprendente para el cerebro 
de un ave! 

Otra ilustración de la naturaleza mediadora de la conducta específica de la espe- 
cie es la improntación (Hess, 1958; Lorenz, 1952). Por ejemplo, un patito está ins- 
tintivamente preparado para aceptar cierta variación de figuras maternas, caracte- 
rizadas por el tamaño, el movimiento y la vocalización. Cuando una figura materna 
así se acepta y se sigue, sólo esta madre particular provocará que se le siga. La 
madre elegida (que puede ser el profesor Lorenz arrastrándose sobre las manos y 
rodillas) se ha improntado. La improntación es una forma de aprendizaje, pero una 
forma muy vinculada con la preparación de un tipo particular de organismo en una 
cierta edad. A excepción de las aves, hay poca evidencia de fijación en la memoria 
en los seres humanos o en el mundo animal. 

Quienes trabajan en la metodología —el estudio de los comportamientos na- 
turales de las especies en sus ambientes originales— han descartado la distinción 
“innata versus aprendida”? como una diferenciación sumamente rígida de “'una 
cosa u otra'”, La conducta y su desarrollo son demasiado complejos como para que 
se les asigne a tales categorías exclusivas. Más bien, los etólogos se esfuerzan 
por analizar y comprender los diversos componentes de un patrón específico de la 
especie, y la manera en que se desarrolla a partir de las interacciones de la expe- 
riencia. 
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La constitución innata del animal —como las formas kantianas o priori— hace 
que se desarrolle de ciertos modos, en razón de la estimulación usual de su nicho 
ecológico. Sin embargo, las variaciones extremas en las condiciones ambientales 
pueden entorpecer este desarrollo normal. 


Maduración versus 
aprendizaje 


La maduración es el principal competidor del aprendizaje en tanto modificador 
de la conducta. Si un patrón conductal madura a través de etapas regulares, al 
margen de la práctica interviniente, se dice que la conducta se desarrolla por me- 
do de la maduración y no a partir del aprendizaje. Si los procedimientos de entre- 
namiento no aceleran ni modifican el desarrollo de la conducta, esos procedi- 
mientos no tienen importancia causal y a los cambios producidos no se les clasifica 
como aprendizaje. Los casos relativamente puros, como la natación en los rena- 
cuajos y la habilidad de volar en los pájaros, pueden atribuirse esencialmente a la 
maduración. Sin embargo. como hemos dicho, muchas actividades no están tan 
bien definidas, sino que se desarrollan a través de una alteración compleja de la 
maduración y el aprendizaje. Un ejemplo ilustrativo es el desarrollo del lenguaje en 
los niños, quienes no aprenden a hablar sino hasta que son lo bastante grandes, 
pero ese desarrollo depende en gran medida de la estimulación apropiada de su co- 
munidad verbal en los momentos decisivos. Los **niños lobos”” que se han encon- 
trado en los bosques o los bebés brutalmente encerrados durante años no tienen 
lenguaje y sólo desarrollan formas rudimentarias y primitivas con mucha lentitud y 
a partir de una paciente enseñanza ([tard, 1932; Lenneberg, 1967). 


Fatiga y habituación 
versus aprendizaje 


Ta sido práctica común el distinguir la fatiga motora o la habituación sensorial del 
aprendizaje propiamente dicho. Cuando un acto motor se repite en rápida sucesión, 
a menudo hay una pérdida en la eficiencia: se vuelve más lento y estrecho hasta 
que finalmente el sujeto tal vez se niegue a ejecutarlo. Decimos que la respuesta 
ha sufrido ''fatiga”” o que su ejecución muestra un ““decremento en trabajo". 
La fatiga aparece más rápido mientras mayor sea el esfuerzo de la respuesta, y la 
recuperación tiene lugar durante un “tiempo de descanso”. En términos de las 
curvas de la ejecución, las curvas de la fatiga y de la recuperación son muy seme- 
Jantes a las de la extinción experimental y de la recuperación espontánea; sin em- 
bargo, usualmente se le ha aplicado la denominación de *“aprendizaje” a la última y 
no a la primera, ¿Por qué? Porque a diferencia de la extinción de un reflejo condi- 
cionado, es probable que la fatiga no induzca cambios duraderos y relativamente 
permanentes en la conducta, Empero, un momento de reflexión demuestra que 
esta defensa es inútil, ya que los efectos de la extinción también son revertibles: 
una respuesta extinguida puede entrenarse, y con poco esfuerzo. Entonces, ¿cuál 
es la diferencia crucial? En realidad, no hay ninguna mientras permanezcamos 
sólo en el nivel conductual de la medición de la respuesta provocada. En la deci- 
sión ha de incluirse otra información; es decir, todas aquellas consecuencias con- 
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ductuales que las descripciones (para el ser humano) implicarían que en un caso el 
sujeto dejó de responder '*porque estaba cansado'*, mientras que en el otra lo hizo 
“porque aprendió que después de oír la campana no recibía comida'* (o cualquier 
otra recompensa). 

No podemos tomar esta decisión acerca de causas hipotéticas sólo a partir del 
decremento de la respuesta. 

Consideremos un segundo tipo de cambio, la Hamada habituación. La mera pre- 
sentación de un estímulo produce una reacción perceptual (lo que Pavlov llamaba 
el reflejo de onentación, o RO). Esta reacción se registra eléctricamente en todo el 
sistema nervioso. Si el estímulo se repite una y otra vez en una serie monótona, el 
RO excitado por cada presentación <:: torna cada vez más débil, y a la postre dis- 
minuye hasta un nivel casi imperceptible? Se dice que los sujetas se han habituado 
a ese estímulo; se han “acostumbrado” a él. La habituación exhibe muchas de las 
propiedades funcionales que atribuimos al aprendizaje (o a la extinción): se disipa 
con el paso del tiempo (como el *olvido”' o la **'recuperación espontánea”'); fácil- 
mente se le distorsiona o elimina mediante la interpolación de un suceso novedoso 
que interfiera. Además, un RO recuperado para un estímulo puede dar lugar a la 
habituación una y otra vez, y en cada momento creará habituación un poco más rá- 
pidamente que antes (como los reaprendizajes de una respuesta olvidada). Final- 
mente, la habituación se generaliza a otros estímulos similares como una función 
de la semejanza de éstos con el estímulo habituado. (En los capítulos 9 y 14 exami- 
naremos el tema con mayor profundidad). Así, la habituación muestra muchas si- 
militudes con las leyes del aprendizaje. 

¿Queremos llamarle aprendizaje a la habituación? Somos ambiguos: en algunos 
casos, sí, en otros, no. Depende de la complejidad del estímulo ante el que se pro- 
duzca la habituación. Si se trata de una descarga eléctrica a una sinapsis sensomo- 
tora de la médula espinal de un gato descerebrado, haríamos mejor en llamarla 
adaptación sensorial. 

Sin embargo, si se trata de un estímulo más complejo (el patrón de un tono, o un 
cuadro) que para su discriminación requiera de la intervención de centros cerebra- 
les superiores, prefeririamos denominarlo aprendizaje. 

En estos últimos rasos, la habituación parece indicar (inversamente) el desarrollo de 
una representación interna del evento de estímulo o de su clase general. La habi- 
tuación de este tipo al parecer es una forma burda del patrón de reconocimiento, 
que tal vez dependa de que el organismo haya aprendido o almacenado una réplica 
o modelo del patrón habituado. Una vez que el modelo está formado, cada estí- 
mulo que entra se compara con él, y la deshabituación ('*sorpresa'') ocurre en el 
caso de que la desigualdad entre ambos sea lo bastante grande. De hecho, las teo- 
rías de la habituación cortical (Sokolov, 1963, que se discutirán en los capítulos 3 y 
14) emplean tales conceptos de modelos internos y de procesos de desigualdad. Y 
sin lugar a dudas, el patrón de reconocimiento es resultado del aprendizaje, de 


3La habitnación se distingue de la adaptación de los Órganos de los sentidos, que ocurre dentro de 
las células retinianas durante la adaptación a la luz; o el blanqueo diferencial de pigmentos de colar en la 
retina que nos hace ver diferentes colores en sucesión cuando miramos continuamente a una luz ama- 
rilla de elevada intensidad (Cormsweet, 1970). En estos casos, la responsabilidad reducida o alterada 
puede rastrearse directamente per los cambios en el recefitor. 
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modo que la habituación es uno de aquellos casos que se encuentran en las fronte- 
ras de nuestro vago concepto de aprendizaje. 


Ejecución versus factores 
del aprendizaje 


El aprendizaje es una inferencia que se efectúa a partir de la ejecución y sólo 
existe confusión si ésta y el aprendizaje se igualan. Los conceptos de aprendizaje 
versus ejecución son paralelos a los conceptos de disposición versus actualización; 
es decir, a saber cómo hacer algo en contraposición a hacerlo en verdad. La ejecu- 
ción puede ser pobre en una prueba de retención debido a muchas razones distin- 
tas de la falta de aprendizaje temprano. El tema de la motivación o el del impulso 
aquí resulta pertinente: los motivos o los impulsos son algunos de los factores psi- 
cológicos responsables de convertir el conocimiento en acción. Una rata que sabe 
encontrar su camino en un laberinto para llegar a la comida contenida en una caja 
meta, no lo haría si regularmente tuviera alimento a su alcance. Debe tener ham- 
bre para demostrar lo que sabe. Otro caso ilustrativo es Ja ejecución de un sujeto 
que se encuentra enfermo o bajo la influencia de drogas o tóxicos. El hecho de 
que la ejecución de un acto aprendido fracase si el sujeto está drogado no quiere 
decir que éste no lo aprendiera ni que lo haya olvidado. Cuando se ha restaurado el 
estado normal, el rendimiento vuelve a los niveles usuales sin la intervención de 
un entrenamiento, La rotulación de una droga, una enfermedad, o la saciedad de 
alimento como “'reductores de la ejecución”, en vez de ser factores de ''no 
aprendizaje'” dependen de la »eversibilidad de su acción. La conducta retorna 
cuando el sujeto “se libera de la influencia” de la droga o de la enfermedad. Si, 
por otra parte, la conducta original aprendida no se recupera después de que des- 
aparecieran los efectos inmediatos de la droga, entonces cabría decir que la droga 
ha tenido un efecto axrtimemorístico, que bloquea la consolidación de una huella de 
la memoria, la destruye o impide su expresión. En el capítulo 14 se reseñará la bi- 
bliografía especializada acerca de los efectos de anticonsolidación de ciertas drogas. 


ASPECTOS QUE SEPARAN A LAS TEORÍAS 
DEL APRENDIZAJE 


Aunque es difícil elaborar una definición del aprendizaje que cubra la diversidad 
de formas y excluya otras causas del cambio de la conducta, la definición del apre- 
dizaje mismo no constituye la fuente central de diferencias entre las teorías del 
aprendizaje, Las divergencias se dan es cuestiones de interpretación, no de defi- 
nición. 

Todo el mundo comprende que las definiciones aceptables sólo provienen de 
teorías científicas satisfactorias acerca de los fenómenos en cuestión. El apren- 
dizaje es uno de esos conceptos vagos y abiertos que incluye diversos subtipos. 
Algunos psicólogos creen que deberíamos abandonar una denominación tan gene- 
ral para reunir toda una gama de tipos de efectos de la experiencia. Sin embargo, 
en la psicología contemporánea el aprendizaje se asemeja más al encabezado de un 
capítulo que a un término técnico y éste aún sigue cumpliendo una útil función en 
contextos no técnicos, 
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Veamos algunos temas que han surgido en la formulación de las teorías. Como 
dijimos. la principal división conceptual dentro de los enfoques psicológicos es la 
que existe entre el empirismo y el racionalismo. Una tesis fundamental del empi- 
rismo es que el aprendizaje se produce a través de la asociación contigua de even 
tos o ideas. Este marco de referencia asociacionista fue aceptado par casi todas las 
teorías y por los teóricos del aprendizaje de la primera mitad de este siglo: Pavlov, 
Guthrie, Thorndike. Ebbinghaus, Hull, Skinner, y Tolman, La única oposición real 
fue la de los psicólogos de la Gestalt, la de los teóricos del procesamiento de la in- 
formación, la de los psicólogos cognoscitivistas. En algunos estudios recientes 
(Anderson, 1976, Anderson y Bower, 1973) se sintetizan estos enfoques. 

Una segunda división ha sido causa de contienda incluso dentro de las teorías 
asociacionistas. Se trata del conflicto entre las teorías del estímislo respuesta y las 
cogmoscitivistas. Esta división originó muchas controversias durante los años me- 
dios de la teoría del aprendizaje, desde aproximadamente 1925 hasta 1965. Los 
teóricos del estímulo-respuesta incluyen a los asociacionistas mencionados, a ex- 
cepción de Tolman, que fue el primer sistematizador de la teoría cognoscitivista. 
Comencemos con el examen de tres tipos de preferencias en las cuales los teóri- 
cos de estímulo-respuesta tienden a diferir de sus colegas cognoscitivistas. 

1. Intermediarios periféricos versus intermediarios centrales. Desde que el con- 
ductista John Watson sugirió que el pensamiento podría ser ''meramente”" la rea- 
lización de movimientos de habla subvocal, los teóricos del estímulo respuesta (£- 
R) han preferido encontrar intermediarios de respuesta o de movimiento para que 
sirvan como integradores de las secuencias de la conducta. Tales intermediarios 
producidos por el movimiento pueden clasificarse como mecanismos penféricos 
(muy alejados del cerebro) o como intermediarios centrales (ideacionales). Los 
teóricos E-R afirman, por ejemplo, que la carrera de una rata hambrienta a través 
de un laberinto hasta una lejana caja que contiene comida está en parte estructu- 
rada por respuestas pequeñas e implícitas de comer alimento, como la masticación 
y la salivación, que aparecen como anticipación a la meta a medida que la rata corre 
por el laberinto. El teórico E-R presupone que estas respuestas en miniatura ocu- 
rren aun cuando no sean observables. El teórico cognoscitivista, por otro lado, in- 
fiere con más libertad procesos centrales (cerebrales), tales como recuerdos o ex- 
pectativas, como integradores de la conducta de búsqueda de meta. Las diversas 
preferencias subsisten en este caso porque ambos tipos de teóricos dependen de 
inferencias acerca de la conducta observada, y éstas en ningún caso pueden veri- 
ficarse de modo directo. Potencialmente es más fácil verificar los movimientos de 
la lengua en el pensamiento, que descubrir una huella de memoria revivida en el 
cerebro, pero de hecho tal verificación no se presenta con la precisión necesaria 
coma para fundamentar una adhesión a esa teoría, Por ejemplo, nadie ha demos- 
trado que los pensamientos de un contenido muy distinto producen en realidad di- 
ferentes movimientos en miniatura de la lengua o de las cuerdas vocales, Aún 
más, si reaccionamos de diverso modo dependiendo de nuestros pensamientos. 
En tales circunstancias, no es forzada la elección entre la explicación periférica y la 
central, y el fayorecer a una o a otra posición depende de otras preferencias sis- 
ternáticas más generales. 

2. Adquisición de hábitos versus adquisición de estrecturas cognoscitivas. El teó- 
rico de estímulo-respuesta y su colega cognoscitivista presentan distintas solu- 
ciones a esta pregunta: ¿qué se aprende? El primero responde '*hábitos””; el se- 
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gundo, “estructuras cognoscitivas” o '*conocimiento factual””. La primera postu- 
ra recalca el desarrollo de pequeñas secuencias de respuesta; la segunda destaca 
el conocimiento factual, como el del niño que aprende dónde se guardan los cara- 
melos. Es evidente que la gente adquiere ambos tipos de conocimiento: conoci- 
miento de praceso (habilidades habituales) y conocimiento factual. Entre los te- 
mas polémicos se encuentra el que se refiere a si ambos tipos de conocimiento 
pueden reducirse a uno; por ejemplo, a los hábitos complejos, como afirman los 
teóricos £E-R. Así, un teórico E-R intentaría representar una pequeña parte del 
conocimiento factual que alguien posee (Chicago está en Illinois) a] notar que ese 
conocirniento hace asequible un gran número de disposiciones a responder en si- 
tuaciones apropiadas. Se incluiría aquí un conjunto de hábitos para contestar “Tlli- 
nois'” cuando a una persona se le pregunta en qué estado se encuentra Chicago. 
Pero los cognoscitivistas argumentan que esta identificación implica una confusión 
básica; que nuestro concepto cotidiano de responder a una pregunta (al afirmar 
una proposición) es un tipo lógico completamente distinto de nuestro concepto co- 
tidiano de una respuesta o reacción. Las respuestas como la del reflejo patelar a 
un golpecillo no afirman ningún tipo de proposición, y la expresión reflexiva de 
“*ilinois”” a una pregunta no constituye una evidencia real de conocimiento. Tales 
temas generan muchas polémicas. Dejando a un lado el caso de los seres humanos 
lingúísticos competentes, una cuestión menor es si el conocimiento que tienen los 
organismos inferiores y no verbales puede representarse adecuadamente en tér- 
minos e hábitos de estímulo-respuesta. Este problema es más difícil de resolver. 
Es curioso que Edward Tolman comprobara su teoría de la expectancia cognos- 
citiva del aprendizaje sólo con animales, quizá con la creencia de que para una 
teória cognoscitivista del aprendizaje humano, el caso ya era obvio. 

3. Ensayo y error versus discernimiento en la solución de problemas. Cuando se 
enfrenta a un problema nuevo, ¿cómo arriba a una solución el sujeto que aprende? Los 
teóricos E-1? afirman que los sujetos ensamblan sus hábitos a partir de situaciones pa- 
sadas apropiadas al nuevo problema, para responder ya sea con arreglo a los elementos 
que el nuevo problema tiene en común con otros conocidos, o de acuerdo con as- 
pectos de la nueva situación que son similares a otros encontrados antes. Si éstos 
no llevan a una solución, los sujetos recurren al ensayo y error, y sacan de su re- 
pertorio conductual una respuesta tras otra hasta que resuelven €l problema. Los 
teóricos cognoscitivistas aceptan gran parte de esta descripción de lo que hacen 
los aprendices, pero agregan interpretaciones que sus colegas E-R no ofrecen. 
Señalan por ejemplo, que aun si se admite toda la experiencia indispendable con 
las partes de un problema, no hay garantía de que los sujetos que aprenden sean ca- 
paces de recurrir a estas experiencias en busca de la solución. Tal vez estén en 
condiciones de resolver el problema si éste se presenta de una forma, pero no 
pueden solucionarlo si se presenta de otra. Para que el aprendizaje más temprano 
tenga cierta repercusión, la manera usual de los sujetos de describir el problema 
debe hacer contacto con alguna descripción de un problema relacionado que resol- 
vieron antes, y tales contactos producen “'discernimiento*” de la solución. El teó- 
rico E-R prefiere observar la historia pasada del sujeto que aprende en búsqueda 
de las fuentes de una solución, mientras que el psicólogo cognoscitivista tiende a 
observar la estructuración contemporánea del problema. 

Estos tres aspectos (intermediarios periféricos versus centrales, adquisición de 
hábitos versus adquisición de estructuras cognoscitivas, y ensayo-error versus dis- 
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cernimiento en la resolución de problemas! dan una idea de las diferencias entre 
estos dos tipos de teorías. 


OTROS ASPECTOS CRÍTICOS 


Algunas cuestiones se encuentran fuera del conflicto entre las teorías E-R y las 
cognoscitivistas. Así, dos psicólogos E-R pueden diferir en cuanto al papel que des» 
empeña el reforzamiento en el aprendizaje, y los teóricos cognoscitivistas pue- 
den discrepar acerca de la interpretación de la extinción. Cuatro de estos aspectos 
bastarán para alertarnos respecto de algunas controversias dentro de la teoría del 
aprendizaje. 

1. Contigiiidad versus reforzamiento. La ley más antigua de la asociación afirma 
que las ideas experimentadas juntas tienden a asociarse. Hasta nuestros días éste 
ha sido el principio de la asociación por contigtiidad, aunque los psicólogos £-R 
describen la asociación corno existente entre estímulos y respuestas, y no entre 
ideas. Algunos teóricos han aceptado el principio de la asociación sólo por la conti- 
gúidad pura; por ejemplo, Guthrie —un psicólogo E-R— y Tolman, un psicólogo 
cognoscitivista. Otros insisten en que el aprendizaje no se produce sólo a partir de 
la contigúidad; afirman que para que se formen las asociaciones debe existir algún 
lipo de reforzamiento, algún equivalente a la recompensa o al castigo. 

2. Extinción de las respuestas aprendidas. Aunque una respuesta recompensada 
esté bien aprendida, se extinguirá si ocurre repetidas veces sin reforzamiento. Se 
sabe que diversas condiciones de entrenaniento indluyen sistemáticamente sobre 
la persistencia con la que el organismo continúa respondiendo durante el periodo de 
extinción. Hay varias teorías plausibles de la extinción, y únicamente en ocasiones 
seles puede clasificar sólo como E-X o como cognoscitivistas. Una teoría aceptable 
es que durante la extinción el animal simplemente aprende a no esperar ninguna 
recompensa, y deja de responder a esa expectativa. Una teoría alternativa su- 
giere que la no recompensa es aversiva (frustrante) y que pone en marcha proce- 
sos inhibitorios activos que compiten con la ejecución de la propia respuesta antes 
recompensada. Ambas teorías pueden afinarse para manejar los principales resul- 
tados acerca de la extinción. 

3, Aprendizaje por saltos versis pequeños incrementos, La posibilidad de que el 
aprendizaje se produzca en su nivel más básico de una manera de todo-o-nada fue 
propuesta por Guthrie, y ha recibido apoyo de diversas fuentes. Por supuesto, la 
alternativa es que el aprendizaje ocurre de forma gradual. Las modificaciones en el 
aprendizaje pueden tener lugar incluso “por debajo del umbral”*, de modo que tal 
vez sean necesarios diversos ensayos antes de que los resultados del aprendizaje 
alcancen el umbral y comiencen a revelarse en la ejecución. Esta era la posición de 
Hull. Entonces, la discrepancia no es entre psicólogos E-R y cognoscitivistas; 
dentro de cualquiera de esos campos, pueden los psicólogos adoptar posiciones 
opuestas acerca del tema del aprendizaje de todo-o-nada. 

4, ¿Uno u más tipos de aprendizaje? Teóricos de varias corrientes han argu- 
mentado en favor del reconocimiento de diferentes tipos de aprendizaje que si- 
guen leyes distintas. Teóricos como Mowrer y Thorndike sostenían que las res- 
puestas emocionales (del sistema nervioso autónomo) se asocian con base en la 
mera contigitidad de su evocación a un estímulo neutral, mientras que las respues- 
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tas instrumentales (de la musculatura esquelética) requieren de la adición de una 
recompensa o castigo. Por su parte, Hull argumentaba que el mismo principio de 
reforzamiento interviene en todas las situaciones de aprendizaje. 

Esta breve introducción sugiere que los que parecen ser puntos de vista opues- 
tos entre la teoría £-R y la cognoscitivista quizá estén basados en diferencias de 
inclinaciones, cada una de ellas con la posibilidad de una enunciación persuasiva, 
y hasta cierto punto justificable. 


El diseño de este libro 


Los capítulos siguientes se disponen en grupos de acuerdo con su afinidad con 
las teorías del estímulo y la respuesta, la del asociacionismo conductual 
(empirismo), o la cognoscitiva organizacional (racionalismo). Las categorías con- 
ductual y cognoscitivista servirán para clasificar a la mayor parte de las teorías 
del aprendizaje, aunque hay conjuntos importantes de investigaciones que son in- 
dependientes de ambas. El trabajo de B. F. Skinner y sus seguidores se examina 
en la primera sección, puesto que se trata de un conductista que rechaza al cog- 
noscitivismo, y no porque acepte la teoría E-R o el asociacionismo. Ai trabajo acer- 
ca del aprendizaje verbal en ocasiones se le considera como el remanente de la 
labor de los funcionalistas, pero se Je incluye en la primera sección porque su teoría 
unificadora se refiere al aprendizaje de asociación, Después de revisar las prin- 
cipales teorías y posiciones, cada sección finaliza con un capítulo en el cual se pre- 
sentan los desarrollos recientes en esa clase de teoría del aprendizaje. A continua- 
ción de las dos secciones principales acerca de la teoría conductual y la 
cognoscitiva se incluyen dos capítulos no teóricos, en uno de los cuales se examina 
la investigación acerca de la neurofisiología del aprendizaje, y en el otro las aplica- 
ciones de las ideas del aprendizaje en la psicología educativa. 

Los restantes capítulos presentan una variedad de posiciones sistemáticas con 
experimentos que comprueban las afirmaciones de las mismas. Algo se aprende de 
ellas: cada una ha descubierto fenómenos que enriquecen nuestros conocimientos 
acerca del aprendizaje. Al mismo tiempo, ningura ha logrado proporcionar un sis- 
tema invulnerable a la crítica. La construcción de una teoría del aprendizaje total- 
mente satisfactoria todavía es una tarea inconclusa. Pero esto es propio de la natu- 
leza de la ciencia: el único campo de investigación terminado es el que está muerto. 


LECTURAS COMPLEMENTARIAS 


Libros de consulta acerca de la psicología del aprendizaje: 
Gagné, R. M., The conditions of leaming, 1970 
KHulse, S. H., Deese, J. y Egeth, H., The psychology of learning, 1975. 
Kimble, G. A., Hilgard and Merquis' conditioning and leaming, 1961. 
Kintsch, W., Leaming, memory, and conceptual processes, 1970. 
Puntos de vista contrastantes con el aprendizaje: 


Anderson. J. R. y Bower, G. H. Hienan associativc memors, 1973. 
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Esics, W. K. etal.. Modern learning theory, 1954. 

Goldstein, H. et el., Controversial issues in learning, 1965, 

Hil, W. F., Learning: A surory of psvchological interpretations, 1971. 
Koch, 5. (dir.), Psychology: A study of a science, vol, 2, 1959. 


The Annual Review of Psychology, revista que apareció por primera vez en 1950 y cada 
año analiza críticamente la bibliografía teórica y experimental acerca del aprendizaje. Las re- 
sejias son útiles no sólo como indices para la bibliografía sino también porque incluyen Jas 
tendencias que los críticos advierten en teoría y experimentación. 

The psychology f learning and motivation: Advarces in research and theory, editado por G. 
H. Bower, se ha publicado anualmente desde 1967; cada volumen contiene numerosos 
capítos escritos por eminentes teóricos del aprendizaje (de todas las tendencias), quienes 
critican las investigaciones de otros y las propias. 
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El conexionismo 
de 
Thorndike 


Durante casi medio siglo una teoría del aprendizaje predominó sobre todas las 
demás en los Estados Unidos, a pesar de los numerosos ataques que recibiera y 
del surgimiento de muchos rivales. La preeminencia de la teoría de Edward L. 
Thorndike (1874-1949), enunciada por vez primera en su obra Animal intelligence 
(1898) fue correctamente evaluada por Tolman:; 


La psicología del aprendizaje animal, para no mencionar la del aprendizaje infantil, ha 
sido y es todavía una cuestión de estar de acuerdo o disentir con Thorndike, o de inten- 
tar superarlo en aspectos menores. Los psicólogos de la Gestalt, los de reflejos condicio- 
nados, los del signo Gestalt; todos en los Estados Unidos al parecer hemos tomado a 
Thomiike, de modo manifiesto o encubierto, como nuestro punto de partida (1938, pág. 11). 


La base del aprendizaje que Thorndike propuso en sus primeras obras era la 
asociación entre las impresiones de los sentidos y los impulsos para la acción o 
“*respuestas””. Á esta asociación se le conoció como “*vínculo”” o “conexión”. 
Debido a que son estos eslabones entre las impresiones sensibles y las respuestas 
bss que se fortalecen o debilitan en la creación y destrucción de los hábitos, al sis- 
tema de Thorndike en ocasiones se le denomina psicología ““de vínculo'” o senci- 
llamente “conexionismo””. Como tal, es la psicología original del aprendizaje de 
estímulo y respuesta (E-R), 

Aunque las versiones más recientes de la psicología E-R redujeron la importan- 
cia que se adjudicaba a las interpretaciones de Thorndike acerca del aprendizaje, 
no debemos pensar que sus opiniones sólo tienen interés histórico, ya que aún in- 
fluyen en gran parte de la experimentación. Casi un cuarto de siglo después de 
que Tolman vertiera los conceptos que acabamos de transcribir, Postman, otro 
activo investigador en el campo del aprendizaje, declaró: 


El cuadro del proceso del aprendizaje que Thorndike delineó hace más de 50 años aún 


es vigente. No hay ninguna teoría global del aprendizaje humano que pueda permitirse el 
lujo de ignorar su legado (1962, pág. 397). 
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EL CONEXIONISMO ANTES DE 1930 


La teoría de Thorndike sufrió muy pocos cambios entre 1898 y 1930. Durante 
estos años el autor se dedicó fundamentalmente a las aplicaciones de su teoría o 
problemas de importancia educativa o social. Debido a la estabilidad de los concep- 
tos a lo largo de ese periodo, cualquiera de las numerosas obras de Thorndike 
puede seleccionarse como muestra de su teoría. Su principal trabajo, del cual se 
han tomado la mayor parte de las referencias que aparecen a continuación, es la 
obra en tres volúmenes titulada Educacational psychology (1913-1914), que repre- 
senta al sistema en la cúspide de su populandad. 


Aprendizaje por ensayo y error 


Thorndike identificó la forma más característica de aprendizaje en los animales 
inferiores y en el ser humano como aprendizaje por ensayo y error o, como después 
prefirió denominarlo, aprendizaje por selección y conexión. En esta situación para- 
digmática los sujetos que aprenden se enfrentan a un problema: deben alcanzar 
una meta; ya sea escapar de una caja-problema, conseguir algún alimento o ganar 
dinero. Y lo hacen cuando seleccionan una respuesta entre un número de posi- 
bilidades, ejecutan esa respuesta, y en consecuencia arriban a un resultado. Un 
ensayo se define por el tiempo o por el número de errores que abarque un único 
intento de obtención de la meta. Los primeros experimentos de Thomdike eran 
de este tipo, realizados principalmente con gatos, aunque algunos se hicieron con 
perros, peces y primates (1898, 1911). Cuando Thorndike emprendió sus prime- 
ros estudios, una explicación muy común para la ““inteligencia”” animal era que 
éste “pensaría a fondo”* o razonaría soluciones a la situación problemática. La bi- 
bliografía de la psicología comparada en esa época abundaba en anécdotas relacio- 
nadas con perros y gatos domésticos, y se intentaba demostrar que los animales 
razonan y deliberan antes de escoger el acto que les permita cumplir sus propósitos, 

Thorndike rechazaba tales teorías acerca del comportamiento anima! por consi- 
derarlas una mala proyección antropomórtica de los conceptos mentalistas del lego 
dentro de la mente de la bestia, para tener la satisfacción de haber explicado algo 
cuando en realidad sólo había establecido una caprichosa analogía. Como un verda- 
dero mecanicista de su época, Thorndike ofreció una explicación mecánica del 
aprendizaje animal, en términos de eventos y operaciones elementales que no fue- 
ran más complejos que el comportamiento que debían explicar. Por ejemplo, el 
“razonamiento deliberado'* no es un concepto elemental, sino que requiere del 
análisis en términos más simples. Según Thorndike, (1898, pág. 39), inició sus es- 
tudios '“para darle el golpe de gracia a la despreciable teoría que postula que los 
animales razonan”. 

En el experimento típico — que se reproduce en el primer artículo de Thomdike 
(1898)— se coloca un gato hambriento dentro de una caja como la que aparece en 
la figura 2.1. Dentro de la caja se monta un mecanismo para abrir la puerta: una 
abrazadera de alambre, una manija, un tirador; cuando este dispositivo se manipu- 
la, la puerta se abre y permite la salida del animal para que obtenga un poco de co- 
mida colocada al pie de la puerta. En el análisis de Thorndike, el interior de la caja- 
problema constituye la '*situación de estímulo”, frente a la cual el animal presen- 
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tará un repertorio de comportamientos o respuestas posibles para intentar esca- 
par de la caja. Asi, los ensayos iniciales generalmente se caracterizaron por un 
comportamiento irrelevante y sin éxito durante los primeros minutos (con gran 
manifestación de arañazos, mordidas, frotación, maullidos, agitación, y rasguños 
en el techo), antes de que se activara el dispositivo que abriría la puerta, casi por 
mero *“accidente””. La puntuación de la ejecución registrada en un ensayo dado se 
basaba en la cantidad de tiempo transcurrido antes de que el animal diera la res- 
puesta correcta y escapara, 

En un comienzo, estos periodos eran muy prolongados debido a la abundancia 
de comportamiento irrelevante y surgido al azar. Sin embargo, en ensayos poste- 
riores los lapsos se hacían menores, pero de una forma lenta e irregular. Este 
aprendizaje gradual tiene la gráfica típica de una “curva de aprendizaje””, donde el 
“tiempo transcurrido antes de que se emita una respuesta acertada'* se traza en 
el eje vertical, y los ensayos sucesivos en el eje horizontal. En la figura 2.2 se 
muestran datos correspondientes a cinco gatos diferentes de los utilizados en el 
primer experimento de Thorndike. Esas curvas del tiempo de respuesta expresan 
los grandes valores usuales en un comienzo, que se hacen más pequeños y rela- 
tivamente estables hacia el término de 30 a 70 ensayos de práctica. Mientras las 
curvas de la figura 2.2 pertenecen a sujetos aislados, las curvas de aprendizaje 
más típicas trazan la puntuación de la ejecución promedio de un grupo de sujetos a 


Figura 2.1. Dibujo de una de las cajas-problema, de Thomdike. El animal encerrado, 
podia abrir la puerta si tiraba de un dispositivo colocado dentro (tomada de Thorndi- 
ke, 1898). 
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Figura 2.2, Curvas de aprendizaje ensayo-por-ensayo de cinco gatos que debian tirar 
de un arillo de alambre para escapar de una caja-problema. Los animales fueron en- 
trenados durante unos diez ensayos al día (tomada de Thorndike, 1898) 


los que se trata de modo similar en los ensayos. Esta situación a menudo produce 
curvas de aprendizaje más uniformes y graduales. 

Este carácter gradual sugirió a Thorndike que en realidad el gato no “cae en la 
cuenta”' ni “discierne”” el método para escapar, sino que lo aprende al grabar pau- 
latinamente las respuestas correctas y desechar las equivocadas. Para Thorndike, 
lo importante era que la grabación gradual de las respuestas recompensadas y la 
eliminación de las que habían fracasado constituía la explicación automática y me- 
canicista del cambio en la ejecución del animal desde los primeros hasta los últimos 
ensayos de entrenamiento. No se necesita de gran inteligencia para mediar tal 
aprendizaje mecanicista. Después de repetir sus diversos experimentos con va- 
ñas especies de animales y muchos tipos de cajas-problema, Thorndike llegó a la 
conclusión de que “*no había logrado encontrar ningún acto que al menos pareciera 
deberse al razonamiento”. 


La primera ley del efecto 


La principal contribución de Thorndike a la psicología fue la formulación de la 
llamada Ley del efecto. El estudiante no debe dejarse llevar por el término ley, ya 
que refleja el uso que de él hacían los científicos mucho tiempo atrás. En la actua- 
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lidad nos referimos a ella sólo como hipótesis; es decir, como conjetura acerca 
de los tipos de eventos que originan el aprendizaje. 
Thorndike formuló su ley mecanicista del efecto en los siguientes términos: 


De entre diversas respuestas dadas a la misma situación, si todo lo demás permanece 
constante, aquellas que van acompañadas o seguidas muy de cerca de satisfacción para el 
anima] se conectarán más frmemente con la situación. ..; aquellas acompañadas o segui- 
das muy de cerca de incomodidad para el animal, y si todo lo demás permanece constante, 
encontrarán debilitadas aus conexiones con esa situación (1911, pág. 244). 


Así, las recompensas y las no recompensas, o los éxitos y los fracasos, se pro- 
ponen como mecanismos para la selección de la respuesta más adaptativa. Este 
principio se asemeja mucho al proceso de la selección natural mediante la adapta- 
ción exitosa o la supervivencia del más apto, que constituye el fundamento de la 
teoría de Charles Darwin sobre la evolución de las especies. Al igual que otros psi- 
cólogos comparativos de su época, Thorndike recibió la influencia —intelectual- 
mente atractiva— del análisis de Darwin acerca de la selección de las especies. 

Thorndike comprendió que su ley del efecto agregaba un complemento importante 
ala ley de la formación del hábito mediante la repetición (la llamada ley del ejercicio): 


Pero la práctica sin ceto —con igual conformidad hacia el éxito o el fracaso mo lleva a la 
perfección, y el sistema nervioso se aleja de las modalidades en las cuales se ejercita con 
la incomodidad resultante, Cuando se omite la ley del efecto, cuando la formación del h4- 
bito se reduce al supuesto efecto de la mera repetición, los dos resultados son casi se- 
guros, Te6ricamente es muy poco lo que puede explicarse acerca de la conducta humana 
mediante la ley del hábito; y a partir de la práctica resnitante se estimulan formas de ins- 
trucción improductivas o que implican un gran desperdicio (1913, pág. 22). 


El interés de Thorndike por las recompensas y las causas del aprendizaje, na- 
cido en sus experimentos con animales, continuó a medida que volcaba su atención 
al aprendizaje que se llevaba a cabo en las escuelas. Allí dominaban los argumentos 
acerca del castigo, la promoción, las prácticas de calificación y otros incentivos, 
aun cuando los psicólogos académicos no habían advertido la importancia de los 
conceptos motivacionales, 

Los experimentos que realizó con animales ejercieron una profunda influencia 
en su pensamiento acerca del aprendizaje humano. Llegó a convencerse contra- 
riamente a las creencias populares de que la conducta animal no estaba muy me- 
dida por las ideas; por el contrario, las respuestas se daban directamente a la si- 
tuación, tal como ésta se percibía. Aunque no negó por completo la ideación en los 
animales, aseguraba que la mayor parte de su aprendizaje se explicaba por la cone- 
xión directa de los actos Con las situaciones a través de la acción automática de la 
ley del efecto, sin mediación de las ideas. La similitud de las curvas de aprendizaje 
en los sujetos humanos que aprendían muchas asociaciones difíciles (como un vo- 
cabulario extranjero) con aquellas que correspondían a animales, lo convencieron 
de que los mismos fenómenos mecánicos esenciales, evidentes en el aprendizaje 
animal, son también fundamentales en el aprendizaje humano. Aunque siempre fue 
consciente de la mayor sutileza y alcance del aprendizaje humano, mostró prefe- 
rencia por comprender el aprendizaje más complejo en términos de principios sea- 
cillos, y por identificar las formas más simples del aprendizaje humano con el de 
los animales. 
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Tanto la teoría como la práctica requieren de recordatorios enfáticos y frecuentes de 
que el aprendizaje humano es fundamentalmente la acción de las leyes de la preparación, 
el ejercicio y el efecto. Ante todo, el hombre es un mecanismo asociativo que trabaja para 
evitar el desequilibrio de los procesos vitales de las neuronas. Si comenzamos por fabricar 
capacidades y facultades imaginarias, si eludimos el razonamiento con términos vagos y 
vacíos, o si quedamos perplejos e inmóviles por la extraordinaria versatilidad y creatividad 
de las formas superiores de aprendizaje, nunca llegaremos a entender el progreso del 
hombre rú a controlar su educación (1913, pág. 23). 


Los punzantes ataques de Thorndike a la vacuidad de las explicaciones menta- 
listas constituyeron un marco de referencia para las teorías mecanicistas E-R que 
habrían de dominar en el estudio del aprendizaje humano durante varias décadas. 


Objeciones a la primera ley del efecto 


Como hemos dicho, la ley del efecto se refiere al fortalecimiento o debilita- 
miento de una conexión como resultado de sus consecuencias. Cuando se esta- 
blece una conexión modificable que va acompañada o seguida de un estado satis- 
factorio de cosas, se incrementa la fuerza de aquélla; si se efectúa la conexión, y 
va seguida del castigo de un estado desagradable, su fuerza disminuye. Thorn- 
dike concibió la fuerza de una conexión en términos de la probabilidad de que la res- 
puesta se produzca en la situación pertinente. Las respuestas más probables tam- 
bién ocurrían con mayor prontitud en una situación de ensayo y error en la que los 
sujetos prueben una respuesta tras otra hasta dar con la correcta. 

Cuando se formuló la ley del efecto, los críticos de la época le objetaron dos su- 
puestos fundamentales. En primer Jugar, se dijo que la satisfacción y la molestia 
eran términos subjetivos, inapropiados para la descripción del comportamiento 
animal. Pero Thorndike se adelantó a sus críticos, ya que había estipulado lo que 
quería denotar con “estados de cosas'' en términos operativos: 


Por un estado de cosas satisfactorio me refiero a aquel que el animal no intenta evitar, y 
a menudo hace cosas para mantenerlo o renovarlo. Por un estado molesto me refiero a 
una situación que el animal no trata de preservar, ya que con frecuencia hace algo para 
terminar con él (1913, pág. 2). 


Estas definiciones impiden que la ley del efecto sea circular, puesto que los es- 
tados de cosas caracterizados como satisfactorios y como molestos se especifican 
independientemente de su influencia sobre Jas conexiones modificables. La ley del 
efecto estipula, entonces, lo que se esperará que suceda a las conexiones modi- 
ficables anteriores que van seguidas de tales estados. De esta manera, Thorndike 
respondió a la primera objeción. 

La segunda objeción era que el efecto retroactivo de una consecuencia sobre 
algo que ahora se encontraba en el pasado es contrario a las leyes normales de la 
causación. Como el evento de estímulo y respuesta se produce antes de la recom- 
pensa (0 del castigo), ¿cómo podría el segundo ejercer su influjo sobre el suceso 
anterior? El pasado ya no existe, mientras que los efectos sólo se sienten en el 
presente. Esta crítica, al igual que la primera, tiene un defecto lógico. El efecto 
causal del resultado sobre la conexión £-R se revela en la probabilidad de recu- 
rrencia de la respuesta cuando ocurre la situación siguiente. El que tal efecto se 
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compruebe o no en el futuro es una cuestión de observación y experimentación, 
no se trata de una hipótesis que habrá de negarse con fundamentos lógicos. Sin 
embargo, esta segunda objeción plantea un pequeño problema a la teoría psico- 
lógica; si se retrasa el resultado de la recompensa o del castigo después de la res- 
puesta crítica, debe postularse algún mecanismo que conserve la información 
acerca de qué respuesta ocurrió a fin de que el resultado fortalezca esa respuesta 
de modo selectivo. Las teorías posteriores de la “'recompensa demorada'* pro- 
porcionan explícitamente cierto mecanismo de memoria de corto plazo para que 
desempeñe esta función de mantenimiento de la información. No obstante, Thorn- 
dike no consideró que esto constituyera un problema crítico. 

En lenguaje llano, la ley de Thorndike estipula que las recompensas o los éxitos 
incrementan el aprendizaje de la conducta recompensada, mientras que los casti- 
gos y los fracasos reducen Ja tendencia a repetir ese comportamiento. Gran parte 
de esta hipótesis es sólo una reafirmación de observaciones comunes, Pero 
Thorndike fue más allá e insistió en que la acción de las consecuencias es directa, 
mecánica y automática, y no necesita de la mediación de ideas conscientes. Como 
veremos, es precisamente en lo que respecta a estas adiciones técnicas al sentido 
cotmún donde los críticos posteriores, pertenecientes a la psicología cognosci- 
tivista, habrían de atacar la estipulación de Thorndike acerca de la ley del efecto. 
En esta insistencia en torno de la acción mecánica, la formulación de Thomndike se 
anticipó al principio del reforzamiento adoptado por las teorías posteriores de la 
respuesta condicionada. Los últimos cambios en su teoría disminuyeron la impor- 
tancia de las cosas molestas en relación con los satisfactores (véase la ley del efec- 
to revisada, una sección más adelante) y agregaron fenómenos nuevos. Pero la 
importancia central de una ley del efecto modificada persistió en los enunciados fi- 
nales de Thorndike acerca de su posición. 


Principios subordinados 


Thorndike no era un teórico sistemático que propusiera un conjunto coherente 
de principios; más bien tendía a escribir prolíficamente acerca de análisis del 
aprendizaje, e identificaba un número de variables significativas, de factores o 
principios intervinientes en situaciones típicas. En los párrafos siguientes enume- 
raremos algunos de los principios menores que Thorndike describía, y podremos ob- 
servar que, en lo que toca a su generalidad, la desigualdad es evidente. 


Ejercicta 

De una breve relación de las opiniones de Thorndike puede surgir la impresión 
de que la repetición de un hábito incrementa su fuerza, bajo la premisa de que 
“la práctica hace la perfección”. En sus primeras obras, Thorndike se refería a 
este fenómeno como la ley del ejercicio. Esta ley tiene dos formas: el uso de una 
conexión aumenta su fuerza; el deseeso de una conexión (el no practicarla) conduce 
a su debilitamiento u olvido. Sólo más tarde reconoció Thorndike la sutil incon- 
sistencia que existía entre el principio del ejercicio (uso) y su ley del efecto, y rein- 
terpretó entonces el término “uso” para referirlo al “uso correcto recompensado”. 


Preparación Ñ 
El estado de preparación es característico de muchas de las circunstancias en las 
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cuales un sujeto que aprende tiende a sentirse satisfecho o molesto. Thorndike re- 
conoció diversas formas del estado de preparación: si se excita un fuerte deseo para 
una secuencia de acción, la ejecución uniforme de esa secuencia es satisfactoria; si 
tal secuencia de acción se frustra o se bloquea, entonces ese bloqueo resulta males- 
to; si una acción es fatigosa o saciada, el forzar una repetición más del acto también 
resulta molesto, Con estas generalizaciones, Thorndike trataba de cubrir un cierto número 
de situaciones, Ejemplos de las primeras dos reglas son cadenas de conductas con- 
sumatorias, como, en el caso de un niño que va al refrigerador en busca de helado. 
El deseo de alimento lleva a un estado de preparación para las primeras respuestas 
de la secuencia de acción; de modo similar, la ejecución de los primeros pasos de la 
secuencia de acción incrementa el estado de preparación del sujeto para los pasos 
siguientes. (En este principio Thorndike no se refería a la idea de "celeridad de lec- 
tura”, familiar a los educadores. Discutía la celeridad de lectura en términos de 
cuántas habilidades básicas aprende un principiante antes de recibir instrucción 
de lectura.) 


Variación de la respuesta 

Para que una respuesta sea recompensada, es necesario que ocurra. Cuando los 
sujetos que aprenden se enfrentan a un problema, intentan una cosa después de 
otra; al encontrar la conducta apropiada, sobreviene el éxito y el aprendizaje es po- 
sible. Si el organismo es incapaz de variar sus respuestas, es probable que la 
solución óptima nunca se presente. Aun cuando se encuentre que una respuesta a 
una situación dada produce cierta recompensa, todavía hay valor de adaptación en 
ciertas variaciones de esa respuesta, ya que la recompensa puede ser mayor o 
más frecuente para otras. Así, Thorndike reconocía que la fijación prematura de la 
conducta podía ser inadaptada. 


Dissinta predominancia de los ciementos de estimulo 

Los aprendices son capaces de reaccionar selectivamente a elementos muy in- 
tensos o sobresalientes en el problema o situación de estímulo. Es decir, pueden 
tomar el detalle esencial de un patrón complejo y basar en él sus respuestas igno- 
rando otras características que confundirían a un animal inferior. Esta capacidad 
para tratar con las partes relevantes de las situaciones hace posible el aprendizaje 
analítico y de discernimiento, y la selección de los elementos críticos se describe 
en términos de atención o de abstracción. 


Cambio de la asociación 

El principio del cambio de la asociación, de Thormdike, afirma que si una res- 
puesta se mantiene intacta a través de una serie de cambios graduales en la situa- 
ción de estimulación, es posible que al final la respuesta se emita frente a un estí- 
mulo totalmente nuevo. La situación de estímulo se cambia primero mediante la 
adición de ciertos elementos, después por la sustracción de otros, hasta que no 
quede nada de la situación original. Thorndike ilustra este principio con el acto 
de enseñar a un gato a erguirse cuando se le ordena, Primero se cuelga un trozo de 
pescado frente a él mientras se le dice **párate'”; después de varios ensayos y 
mediante los arreglos apropiados, el estímulo del alimento puede omitirse: por sí 
sola, la seña! verbal evocará la respuesta. La enunciación general del principio del 
cambio de la asociación implica que podemos “obtener cualquier respuesta que un 
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aprendiz sea capaz de dar, asociada con cualquier situación a la cual es “sensible?” 
(1913, pág. 15). Esto es similar al condicionamiento en el cual un estímulo con- 
dicionado ('*parate””) sustituye a uno incondicionado (el trozo de pescado). Aun- 
que observó la similitud, Thorndike creía que la respuesta condicionada pavlo- 
viana era un Caso más especializado dentro de la comprensión del principio del 
cambio de la asociación. El principio en cuestión también se asemeja a lo que Skin- 
ner ha llamado “desvanecimiento” o “desaparición”, en el cual el control dis- 
criminativo de una respuesta cambia de un primer estímulo a un segundo, En la 
actualidad, este principio es muy usado en los programas que se diseñan para las 
máquinas de enseñanza. Un ejemplo elemental es el de los niños que aprenden a 
deletrear una palabra nueva al cotejar la presentación de la palabra hablada con la 
escrita, y luego la copian. En un comienzo, el niño copía una palabra (por ejemplo 
lápiz) mientras la escucha y la ve. Después, cuando oye “lápiz”* el niño sólo ve 
una parte de la palabra (por ejemplo, 1-p-Z), y llena con las letras que faltan los es- 
pacios en blanco. En pruebas sucesivas se le muestran cada vez menos letras 
como instigadores (por ejemplo, 1---z) mientras se pronuncia la palabra, y el niño 
debe deletrearla. Finalmente, el niño aprende a deletrear la palabra completa des- 
pués de oírla. Sin embargo, tales aplicaciones educativas son producto del ingenio 
de Skinner y no formaron parte de las numerosas sugerencias de Thorndike acer- 
ca de los problemas prácticos. 


Respuesta por similime e analogía. 

Se presume que Jas respuesta a situaciones nuevas se basan en la asimilación de 
lo nuevo a una situación previamente aprendida, y en dar una respuesta susten- 
tada en la similitud o analogía de ambas. Los aprendices responden a una situación 
nueva como lo harían a una parecida (este fenómeno fue denominado “generaliza- 
ción del estimulo” por los teóricos posteriores); o responden a un nuevo elemen- 
to de la nueva situación para el cual disponen de una respuesta en su repertorio. 
Por lo común, las respuestas se explican por el aprendizaje previo, junto con ten- 
dencias innatas a responder; en este aspecto, nada misterioso envuelve las res- 
puestas a las cosas nuevas, ya que las situaciones novedosas siermpre pueden des- 
componerse en nuevos arreglos basados en características y partes que ya eran 
familiares. 

Pero es necesario elaborar más la opinión de Thorndike acerca de la forma en 
que el aprendizaje se transfiere de una situación de entrenamiento a una segunda 
situación de prueba o a una nueva tarea de aprendizaje, En alguna medida, toda la 
educación formal está dirigida hacia un tipo de transferencia más allá del salón de 
clases, de los conocimientos y habilidades aprendidos en la escuela. Ya sea que la 
manera apropiada de lograr este fin sea enseñar más materias formales --como las 
matemáticas», o prestar mayor atención a las materias prácticas, como la orien- 
tación vocacional y el civismo, el problema reviste gran importancia para los 
educadores, 

Como uno de los primeros psicólogos educativos, Thorndike se interesó por 
ese problema. Su teoría comenzó a despuntar en un estudio experimenta! efectua- 
do en colaboración con Woodworth (Thorndike y Woodworth, 1901), y se estipuló 
formalmente en su temprana obra Educational Psychology (1903). Como hemos 
dicho, la teoría propone que la transferencia depende de la presencia de elementos 
idénticos en la tarea original y en la tarea de transferencia que facilita. Los elemen- 
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tos de estímulo de dos situaciones o los componentes de respuesta de dos habili- 
dades similares pueden ser idénticos. En las materias escolares, la sustancia 
(ideas) o los procedimientos (acciones habilidosas) tienen elementos superpues- 
tos. Por ejemplo, la habilidad de hablar y escribir correctamente es importante 
tanto en el salón de clases como en muchos aspectos de la vida cotidiana. Por ello 
la maestría en tales habilidades sirve a distintos propósitos, y la transferencia debe 
resultar de lo que las diferentes situaciones requieren en común. El procedimiento 
de buscar términos en diversas fuentes —un diccionario, un recetario o un manual 
de química— tienen mucho en Común, a pesar de los distintos contenidos de los 
tres tipos de libros. El que una actividad se aprenda con más facilidad porque otra 
similar se aprendió antes, llevó a Thorndike a postular que esta circunstancia sólo 
podía deberse a que las dos actividades se superponen. La transferencia siempre 
es específica, nunca general y aunque parezca serlo, subsiste el hecho de que las 
situaciones nuevas tienen mucho de las antiguas. 

Hasta cierto punto, y tal como se cuantifica en las pruebas del C/, lainteligencia puede 
considerarse corno una medida de la capacidad general de transferencia de un indi- 
viduo. Es decir, la prueba mide la capacidad para emitir respuestas correctas en 
situaciones relativamente nuevas. Al igual que su teoría de la transferencia, la teo- 
ría de Thorndike de la inteligencia era cuestión del número de conexiones es- 
pecíficas pertinentes: mientras más vínculos tenga el individuo para usar, más in- 
teligente será, 

Además de establecer los diversos principios del aprendizaje ya enumerados, 
Thotndike dedicó mucha atención a la manera de mejorar el aprendizaje de los 
estudiantes. Destacó que éstos dehen interesarse en el material y preocuparse 
por mejorar su aprovechamiento. Se creía que el interés surgía debido a que los 
estudiantes consideraban que la materia era importante para el logro de alguna 
meta. personal; y se decía que el interés motiva la atención y el estudio. Es evi- 
dente que éstos son los principios que fundamentan la mayor parte de los cursos 
de capacitación para los profesores e indudablemente tienen su razón de ser. Sin 
embargo, no son recomendaciones que distingan sólo al enfoque en cuestión, 

Durante el periodo que corresponde a la estabilidad del sistema de Thorndike se 
produjeron muchos cambios en el campo de la psicología, pero no incidieron en él. 
La aparición del conductismo y la renovada importancia atribuida a la respuesta 
condicionada en poco lo afectaron, puesto que los entusiastas de la nueva corrien- 
te utilizaban un lenguaje que Thorndike consideraba similar al suyo. Sin embargo, 
a partir de 1930 revisó y reelaboró su ley del efecto y comenzó a distinguirla con 
mayor claridad del principio del ejercicio que ya mencionamos. 


EL CONEXIONISMO DESPUÉS DE 1930 


Thorndike informó de las revisiones de sus hipótesis en varios artículos y mo- 
nografías efectuadas con varios colaboradores, y los principales resultados se 
recopilaron en dos volúmenes: The fundamentals of learning (19324) y The psy- 
chology of wants, interests, and attitudes (1935). Una serie de experimentos se 
dedicó a la distinción entre los principios de ejercicio versus el efecto en la mo- 
dificación de la conducta. Otro conjunto de estudios se abocó a perfeccionar la ley 
del efecto y a buscar nueva evidencia que la sustentara. 


45 
Refutación de la ley del ejercicio 


El tipo de experimento usado para refutar la ley del ejercicio implicaba situacio- 
nes en las cuales una clase de respuestas se reiteraba en circunstancias que redu- 
cían a) mínimo los efectos recompensantes. (Por ejemplo, a un sujeto con los ojos 
vendados se le pedía que trazara una línea de 10 centímetros, y que repitiera esa 
tarea cientos de veces durante varios días, pero sin recibir información de retro- 
alimentación por parte del experimentador acerca de la exactitud de los trazos. 
Thorndike se interesaba en saber si las respuestas inicialmente inás frecuentes 
por ejemplo, las líneas con longitudes entre 11 y 12 centímetros) “*consumirían'' 
lentamente la fuerza de las respuestas menos frecuentes. A la larga, las respues- 
tas de elevada frecuencia se volverían incluso más probables, y las de baja frecuen- 
cia serían desechadas. Supuestamente, esto obedecía a la implicación de la ley del 
ejercicio, según la cual una respuesta a una situación se fortalece en virtud de su 
mera ocurrencia, y como las probabilidades en todas las respuestas deben sumar 
1.00, el incremento de la probabilidad de una clase de respuestas disminuye la 
probabilidad de otra, 

Los resultados de éste y de otros experimentos similares de Thomdike fueron 
distintivamente negativos; la distribución de probabilidad de las longitudes de lnea 
trazadas en el duodécimo día de práctica era en esencia la misma que la del primer 
día, Sin información o retroalimentación recompensante, se producían relativa. 
mente pocos cambios en la distribución de la respuesta. Por el contrario, si des- 
pués de cada intento de trazar una línea de 10 centímetros se informaba a la persona 
que la raya era demasiado larga o corta, las respuestas mejoraban con rapidez 
hasta que se distribuían apretadamente alrededor de los diez centímetros (Trow- 
bridge y Cason, 1932). 

Este experimento dermestra que la repetición de una siticación sin el conoci- 
miento de la respuesta correcta produce escaso o ningún cambio en las frecuen- 
cias relativas de Jas diversas respuestas, No obstante, Thorndike estaba cons- 
ciente de que algunas variedades de repetición (*“ejercicios””) son importantes, y 
se trata precisamente de aquellas conexiones simples de estímulo y respuesta en 
las cuales los sujetos saben o creen que recuerdan de forma correcta. Por ejem- 
plo, un alumno al que se le ha indicado que recuerde que la capital de Oregon es 
Salem, se cuida de ensayar en silencio la oración o asociación “capital de Oregon- 
Salem””, aun cuando el maestro no suministre reforzamientos verbales. Se sabe 
que éste “ejercicio” implícito de la conexión promueve su retención a largo plazo. 
Thorndike explicaría el efecto de éste y otros tipos similares de ensayo como de- 
bido a una “reacción de confirmación”” interna (o satisfactor) que los sujetos 
supuestamente experimentan después de cada ensayo E-R, como si se dijeran a 
ellos mismos *'capital de Oregon-Salem: correcto”. 


LA LEY DEL EFECTO REVISADA 


Thorndike interpretó un cierto número de experimentos como demostración de 
que los efectos de la recompensa y del castigo no eran iguales y opuestos, como 
se había afirmado en declaraciones anteriores acerca de los efectos de los satis- 
factores y las molestias. En vez de ello, en diversas condiciones la recompensa 
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El tipo de experimento usado para refutar la ley del ejercicio implicaba situacio- 
nes en las cuales una clase de respuestas se reiteraba en circunstancias que redu- 
cían al minimo los efectos recompensantes. (Por ejemplo, a un sujeto con los ojos 
vendados se le pedía que trazara una línea de 10 centímetros, y que repitiera esa 
tarea cientos de veces durante varios días, pero sin recibir inforniación de retro- 
alimentación por parte del experimentador acerca de la exactitud de los trazos. 
Thorndike se interesaba en saber si las respuestas inicialmente más frecuentes 
por ejemplo, las líneas con longitudes entre 11 y 12 centímetros) *“ounsumirían”* 
lentamente la fuerza de las respuestas menos frecuentes. A la larga, las respues- 
tas de elevada frecuencia se volverían incluso más probables, y las de baja frecuen- 
cia serían desechadas. Supuestamente, esto vbedecía a la implicación de la ley del 
ejercicio, según la cual una respuesta a una situación se fortalece en virtud de su 
mera ocurrencia, y como las probabilidades en todas las respuestas deben sumar 
1.00, el incremento de la probabilidad de una clase de respuestas disminuye la 
probabilidad de otra. 

Los resultados de éste y de otros experimentos similares de Thorndike fueron 
distintivamente negativos; la distribución de probabilidad de las longitudes de línea 
trazadas en el duodécimo día de práctica era en esencia la misma que la del primer 
día. Sin información o retroalimentación recompensante, se producían relativa- 
mente pocos cambios en la distribución de la respuesta. Por el contrario, sí des- 
pués de cada intento de trazar una línea de 10 centímetros se informaba a la persona 
que la raya era demasiado larga o corta, las respuestas mejoraban con rapidez 
hasta que se distribuían apretadamente alrededor de los diez centímetros (Trow- 
bridge y Cason, 1932). 

Este experimento demuestra que la repetición de una sifwación sin el conoci 
miento de la respuesta correcta produce escaso o ningón cambio en las frecuen- 
cias relativas de las diversas respuestas. No obstante, Thorndike estaba cons- 
ciente de que algunas variedades de repetición (' “ejercicios'”) son importantes, y 
se trata precisamente de aquellas conexiones simples de estímulo y respuesta en 
las cuales los sujetos saben o creen que recuerdan de forma correcta. Por ejern- 
plo, un alumno al que se le ha indicado que recuerde que la capital de Oregon es 
Salem, se cuida de ensayar en silencio la oración o asociación “capital de Oregon- 
Salerm””, aun cuando el maestro no suministre reforzamientos verbales. Se sabe 
que éste ““ejercicio** implícito de la conexión promueve su retención a largo plazo. 
Thorndike explicaría el efecto de éste y otros tipos similares de ensayo como de- 
bido a una “reacción de confirmación” interna (o satisfactor) que los sujetos 
supuestamente experimentan después de cada ensayo E-R, como si se dijeran a 
ellos mismos ''capital de Oregon-Salem: correcto". 


LA LEY DEL EFECTO REVISADA 


Thorndike interpretó un cierto número de experimentos como demostración de 
que los efectos de la recompensa y del castigo no eran iguales y opuestos, como 
se había afirmado en declaraciones anteriores acerca de los efectos de los satis- 
factores y las molestias. En vez de ello, en diversas condiciones la recompensa 
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parecía ser mucho más poderosa que el castigo. De llegar a confirmarse, esta con- 
clusión, tendría una enorme importancia social, al aplicarse en los campos de la 
educación y la criminología. 

Uno de estos experimentos (19325) se efectuó con pollitos, a los que se intro- 
dujo en un laberinto simple que les daba a elegir tres caminos. Uno de ellos levaba 
a ““bbertad, comida y compañía *”; es decir, a un compartimiento abierto donde ha- 
bían otros pollitos comiendo. Las elecciones equivocadas conducían al confina- 
miento durante 30 segundos. Se registraron estadísticamente las tendencias a 
retornar a la elección anterior si ésta no lleyaba a la recompensa, y a evitarla sj 
conducía al castigo. Thorndike interpretó sus hallazgos de la siguiente manera: 
Los resultados de todas las comparaciones con todos los métodos decían lo mis- 
mo. El recompensar wa conexión siempre la fortalece sustancialmente, el casti- 
garla la debilita poco o nada”" (19325, pág. 58). 

Los experimentos con sujetos humanos consistían en una prueba de vocabulario 
de opción múltiple. Por ejemplo, se daba al sujeto una palabra en español acompa- 
hada de cinco palabras inglesas, una de las cuales era traducción correcta. Seguían 
una segunda y tercera palabras en español, y así sucesivamente toda una Ésta, 
donde cada vocablo tenía traducciones opcionales dispuestas de la misma forma. 
Los sujetos escogerían la palabra traducida, la subrayarían, y entonces escucharían 
decir correcto (La respuesta recompensada) o eguivocado (la respuesta castigada). 
En subsiguientes ocasiones, ¿cómo cambiaban los sujetos sus respuestas en la lista? 
Al igual que ocurrió con los pollitos, la recompensa (correcto) conducía a una repe- 
tición incrementada de la respuesta recompensada, pero el castigo (eguivocado) no 
disminufa la probabilidad de que se repitiera esa respuesta. En seis experimentos 
de este tipo, Thorndike concluyó que el anuncio de equivocado no debilitaba las co- 
nexiones lo bastante como para contrabalancear el pequeño incremento obtenido 
de la mera ocurrencia de la respuesta (19324, pág. 228). En las interpretaciones 
que Thorndike hacía de sus datos había ciertas dificultades estadísticas que pro- 
votaron que subestimase el significado del castigo, En una sección posterior exa» 
minaremos algunas críticas en torno a estas interpretaciones, así como las eviden- 
cias que existen en su favor. 

Thorndike y sus colaboradores se dedicaron a reunir testimonios acerca de la 
relativa eficacia de las recompensas y los castigos en trabajos publicados y en 
otras fuentes que se remontaban a muchos años atrás. La evidencia casi universal 
de un mayor efecto benéfico de la recompensa sobre el castigo proporcionó apoyo 
práctico a los resultados de sus experimentos, que de otra forma se hubiesen criti- 
cado por estar muy alejados de la vida cotidiana (1935, págs. 135a 144, y 248 a 255). 

Ab igual que la refutación de la ley del ejercicio, Thorndike no negó totalmente el 
principio del debilitamiento por efectos secundarios molestos; sólo negó el debi- 
btamiento directo, Según Thorndike, los castigos afectan al aprendizaje de modo 
indirecto, Sustentaba que el efecto indirecto proviene fundamentalmente de instar 
al aprendiz a hacer algo en presencia de una molestia que lo vuelve menos propenso 
a repetir la conexión original. 


Una molestia vinculada a una conexión modificable hace que el animal sienta temor o 
mortificación, que salte hacia atrás; que huya, retroceda, aúlle, ejecute la acción anterior 
con mayor vigor, o haga cualquier otra cosa que se encuentre en su repertorio como una 
respuesta a esa molestia. Pero no hay evidencia de que reduzca la fuerza de la base fi- 
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siológica de la conexión que de alguna manera pueda compararse a la forma en que un 
efecto secundario satisfactorio le agrega fuerza (1932a, págs. 311-313). 


La propagación del efecto 


En apoyo a la ley del efecto en 1933 se presentó una nueva evidencia, la cual se 
describía como Propagación del efecto (1933a, 1933b). La examinaremos en detalle 
ya que se trata de un fenómeno descubierto por Thorndike y difundido exclu- 
sivamente por él. Se utilizó para argumentar en favor de uno de sus postulados: la 
influencia awtomáfica de las recompensas. Los experimentos intentaban demos- 
trar que la influencia de una recompensa no sólo actúa sobre la conexión a la cual 
pertenece, sino también sobre las conexiones temporalmente adyacentes, que 
tienen lugar justo antes o después de la conexión recompensada. El efecto disminuye 
gradualmente, a medida que la conexión se aleja de la recompensa, y fortalece 
incluso a las conexiones castigadas cercanas a aquella recompensada, Al parecer, 
los experimentos apoyaron la acción automática o mecánica de la recompensa 
o el castigo. En un experimento característico se le pedía al sujeto que estipu- 
lara un número del 1 al 10 después de que el experimentador enunciara una pa- 
labra de estímulo, Este adjudicaba entonces una calificación a la respuesta del su- 
jeto —correcto o equivocado— de acuerdo con determinada asignación, dispuesta 
de antemano, de números correctos a cada palabra, En cualquier caso, desde el 
punto de vista del sujeto la asignación de números era arbitraria, y el indicio para 
repetir el número dado en primer término frente a la palabra de estímulo, o para 
cambiarlo en el ensayo siguiente en relación con esa palabra provenía de la reacción 
del experimentador después de presentar cada número, Sin embargo, las listas de 
palabras eran tan extensas que el sujeto no podía recordar muy bien en el segundo 
ensayo qué puntaje se había asignado a cada palabra durante la primera prueba. 

Después de leer la tista varias veces se clasificaban las respuestas del sujeto 
para encontrar la frecuencia con que se repetía la respuesta a una palabra de estí- 
mulo dada, cada vez que ésta se presentaba. Las respuestas recompensadas no 
sólo se repetían con mayor frecuencia, sino que aquellas seguidas por nada (el ex- 
perimentador permanecía callado) se repetían más allá de la expectativa de casua- 
lidad si ocurrían en proximidad temporal a una respuesta calificada como correcto. 

El experimento de Tilton (1945) constituye un buen ejemplo. Repitió el expe- 
rimento de propagación del efecto con rigurosos controles a fin de determinar el 
nivel empírico de repetición de respuesta sin calificarlas con correcto o equivocado 
(es decir, el experimentador permanecía en silencio después de la respuesta del 
sujeto). Tilton también dispuso que una respuesta a un estímulo denominado ca- 
rrecio se rodeara con otros pares E-R a los que sólo se les llama equivocado, y 
viceversa. Entonces procedió a trazar la propagación del efecto en cualquier lado 
de una respuesta aislada recompensada o de una castigada (Filton, 1939, 1945). 
Descubrió que los efectos de correcto y equivocado eran casi iguales; la mención de 
equivocado disminuía las repeticiones casi tanto como correcto las incrementaba., 
En las figuras 2.3 y 2.4. aparecen las gráficas de los resultados de Tilton. 

El estudio de Tilton prueba que cuando las respuestas castigadas son contiguas 
a las recompensadas muestran una tendencia a repetirse con mayor frecuencia 
que las mismas respuestas pero alejadas de la recompensa. Sin embargo, su casti- 
go (el denominarse equivocado) basta, incluso a un paso de la recompensa, para 
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conducir a una menor repetición de la que aparecía si la respuesta no fuera castiga- 
da ni recompensada (figura 2.3). De modo similar, cuando una respuesta que reci- 
be la calificación de equivocado (castigada) se produce en medio de una serie de 
respuestas recompensadas, las respuestas recompensadas contiguas se repiten 
con menos frecuencia que si no se encontraran próximas a la respuesta castigada. 
De nueva cuenta, no obstante, su recompensa (el ser llamadas correcto) es sufi- 
ciente para conducir a su repetición con una mayor frecuencia que la representada 
Por la línea base neutral (figura 2.4). 

Aquí, lo importante para Thorndike es el aparente “gradiente'' de probabilidad 
de repetición de los pares que ocurren cercanos en el tiempo a los pares recom- 
pensados o castigados en aislamiento. Se creía que esta función continua demos- 
traba la propagación del efecto de fortalecimiento automático de una recompensa 
en conexiones contiguas temporales y, de modo similar, la propagación del efecto 
de debilitamiento de un castigo. 


70 
60 
$ 
3 sol 
E 
2 40 
Figura 2.4. Gradiente del efecto en tomoa $ yp| lnea base 
una respuesta calificada con equivocado. $ 
El denominarle equivocadío a una respues- 5 20 
ta disminuye su repetición; calificarla cor — É 
correcto la incrementa Sin embargo, elin- “10 
cremento por haher sido denominada co- 0 
rrecto es menor cuando tal respuesta se -2 -1 0 +1 +2 


encuentra próxima a un equivocado aisla- "Correclos” Respuesta “Corractos" 
do (tomada de Tilton, 1945). anteriores “equivocada” posterlores 


Cap. 2 El conexionismo 49 


La naturaleza sorprendente y contraria a la intuición de tales resultados dio 
Jugar a muchos experimentos, muchos de los cuales intentaron explicar los gra- 
dientes de propagación del efecto (por ejemplo, lus de Tilton) como producto de 
alguna variable de contaminación en la tarea. De hecho, otros factores (como las 
secuencias recurrentes de asignación de número, los hábitos nv aleatorios de asig- 
nación que alteraban la línea base de repetición y la influencia de la disposición o la 
intención de aprender) en realidad influfan sobre los datos de propagación del efec- 
to y, en consecuencia, ponían en duda las interpretaciones originales. Las contro- 
vertidas evidencias relacionadas con este tema se reseñaron en una edición 
anterior de este libro (Higard y Bower, 1966, págs. 23 y sigts.) y en una obra de 
Postman (1962). 


Una explicación alternativa 


Al sopesar nuevamente la evidencia, pareciera que la propagación del efectoes el 
resultado de procesos mucho más sencillos de los que Thorndike suponía. En pri- 
mer Jugar, se recurrió a la propagación del efecto como principio teórico sólo para 
explicar los datos particulares recabados bajo este rubro; y la antigua ley del efec- 
to es lógicamente independiente de que la propagacion se produzca o no. En se- 
gundo lugar, creemos que los datos de la propagación del efecto son quizá el resul- 
tado de la generalización del estímulo entre posiciones seriales dentro de una lista, 
y es posible que no tengan nada que ver con los efectos secundarios de propa- 
gación de una recompensa. Para ilustrar esta explicación, considérese una lista 
breve de ocho reactivos arbitrarios típicos de un experimento de Thorndike, que 
aparecen en la tabla 2.1. En el ensayo 1, se presenta la lista de palabras (taza, hije- 
ras, ...), y a cada una de ellas el sujeto asigna un número del 1 al 10, respuestas a 
las cuales el experimentador, arbitrariamente, siempre dice: ““equivocado”” a ex- 
cepción, por ejemplo, del quinto reactivo de la serie. Después del primer ciclo. 
Sigue otra a través de las series en el que los reactivos se presentan en el mismo 


TABLA 2.1. Eventos ¡ilustrativos en dos ensayos de una tarea de aprendizaje 
asociativo, de Tho:mdike. S y E denotan al sujeto y al 
experimentador, respectivamente. 


Ensayo 1 Ensayo 2 
Posición Palabra Adivinación  Retroalimentación  Adivinación 
serial clave del $ del E del $ 
1 tasa 7 equivocado 2 
2. tijeras 9 equivocado 1 
3. plato 5 equivocado 5 
4 cielo 6 equivocado 6 
S. lápiz 3 CORRECTO 3 
6. libro 1 equivocado 1 
E casa 8 equivocado 8 
8. silla 2 equivocado 6 
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orden, y el sujeto efectúa una asignación para el ensayo 2, como se enumera en la 
última columna. Nuestros hipotéticos datos ilustran la repetición de la respuesta 
'*3” ala palabra lápiz, que había sido recompensada directamente en el ensayo l, 
y también la repetición de las respuestas dadas a los estímulos presentados dos 
pasos antes y después de la conexión recompensada (lápiz-3). Desde luego, esta 
situación ilustra la propagación de los efectos. 

La explicación de la generalización del estimulo para tales datos sería la siguien- 
te (sugerida por Estes, 19692). Primero, concebimos esta tarea de asociación por 
pares como el aprendizaje concurrente de muchas ternas de estímulo-respuesta- 
consecuencia (ocho, en nuestro ejemplo). Dentro de cualquier ensayo de una se- 
cuencia de estímulo-respuesta-consecuencia (E-R-C), hay probabilidad de que el 
sujeto aprenda cualquiera o la totalidad de las tres asociaciones pareadas; es decir, 
E-R, E-C, y R-C, que supuestamente se aprenden de modo independiente. Por 
ejemplo, un índice de una asociación E-C, sería que el sujeto recordara que des- 
pués de haber mencionado la palabra lápiz, el experimentador dijo **correcto”. 
Además —y esto es importante para el tema de la propagación del efecto—, pode- 
mos suponer que la persona identifica la posición serial de cada inciso de una forma 
desigual e imprecisa, aunque de cualquier manera esta posición serial entra en 
asociaciones con los eventos E-R-C que ocurren en ese lugar de la lista. En la que 
presentamos, esto significa que el sujeto podría asociar (durante el ensayo 1) una 
'*posición seria) implícita 5”” a correcto, como una consecuencia. Esta circunstancia 
sería evidente, por ejemplo, en su habilidad posterior para decir, después de estu- 
diar la sta, que un apareamiento ubicado aproximadamente en medio de la lista se 
ha calificado de correcto por parte del observador, (nótese que la palabra correcto 
constituía un evento sobresaliente, aislado en una serie de equivocado, un arreglo 
necesario en los experimentos de propagación del efecto). 

La premisa ulterior de la teoría de Estes es que la mernoria que el sujeto tiene 
de las consecuencias asociadas a un complejo de estímulo, controla si él mismo 
ejecutará o no la respuesta que recuerda haber dado a ese estímulo. Si recuerda la 
que dio a la palabra lápiz, y también que la respuesta a lápiz o a la posición serial 5 
se calificaba como correcto, entonces repetirá la respuesta que recuerda haber 
omitido. Éste es el fundamento del efecto de repetición en las conexiones Segui- 
das de correcto. Si la persona recuerda que la consecuencia de un estímulo (o posi- 
ción serial) se calificó equivocado, dará una respuesta distinta de la que recuerda 
haber proporcionado en el ensayo anterior. Ésta es la razón por la cual eguivocado 
-——si todo lo demás permanece constante— reduce la repetición de las respuestas 
por debajo de una línea base de control apropiado (que es la repetición de la res- 
Puesta dada a un evento neutral, que no es correcto ni equivocado, después de la 
respuesta en el ensayo 1). 

Para tratar con la propagación del efecto sólo necesitamos suponer que el re- 
cuerdo del sujeto acerca de la posición serial que correlaciona con un correcto es 
impreciso; así, la “posición serial 5>correcto”* se generaliza a las posiciones seriales 
vecinas 3, 4, 6 y 7, de acuerdo con la distancia que medie entre las mismas y la lo- 
Calización adecuada. Tal generalización del estímulo es un fenómeno bien 
documentado, de modo que se trata de una suposición razonable. Este principio 
basta para explicar la propagación del efecto. Á manera de ilustración, considérese 
el suceso E-R-C dibro-1-equivocado) que ocurre en la posición seria 6, 


justamente después de correcto en la posición 5. Supóngase gus 4 sujeto recuerda 
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lo que dijo; esto es, el suceso E-R. Si recuerda 'libro-equivocado””, entonces no 
repetirá la conexión “libro-1”” (corno muestran los datos de Tilton que aparecen en 
la figura 2.3). Si la persona olvida el eguivocado para libro, podría recordar inco- 
rrectamente, como un error de generalización, “*posición serial 6 correcto”, 
porque ésta es muy similar a la posición serial 5. Si tal generalización o confusión 
se produce entre posiciones seriales adyacentes, la dispersión del efecto daría lu- 
gar a un factor de ejecución (en vez de un factor de aprendizaje, como Thorndike 
había interpretado). En esencia, esto equivale a una estrategia de “repita co- 
nexiones £-R que usted recuerde haber efectuado en un contexto que se aproxi- 
maba al de la posición serial 5”. 

Esta hipótesis de generalización de posición acerca de la propagación tiene di- 
versas implicaciones. Primero, si en el ensayo 2 a los sujetos se les pide que re- 
cuerden la respuesta dada en el ensayo 1, y si ésta se consignaba como correcto o 
equivocado, la probabilidad de recordar la respuesta anterior es independiente 
de qué efecto siguió (correcto o equivocado); sin embargo, hay una generalización de 
la propagación al recordar consecuencias, como el hecho de que los pares califi- 
cados como equivocado pero en proximidad a un par al que se le adjudicó correcto, 
posiblemente se recuerde después como correcto; lo contrario sucede con un par 
calificado como equivocado rodeado de pares denominados correcto (veáse Nuttin, 
1949, 1953). Esto es exactamente lo que cabría esperar de acuerdo con la teoría 
de la generalización. 

Además, la magnitud de la propagación del efecto se reduce notablemente si los 
estímulos que se presentaron en el ensayo 2 tienen un orden serial nuevo y des- 
igual, Zirkle (1946) descubrió que la propagación del efecto se elimina al mezclar 
los elementos de la lista de prueba; la tendencia a dar una R a un E que ha apare- 
cido cerca de una conexión “E-R correcto”? no se incrementa a no ser que el E se 
repita en la misma posición serial o en Una cercana, como ocurrió en el ensayo 1. 

En el ejemplo anterior se emplea una lista breve y se adopta un patrón fortuito 
de asociaciones para explicar la propagación del efecto; con lístas extensas estos 
factores tendrán menos efectos. Pero debe comprenderse que la propagación del 
efecto era, en el mejor de los casos, pequeña (véanse nuevamente las figuras 2.3 y 
2.4). Así, la atracción de un tema teórico crítico queda ilustrada por el gran esfuer- 
zo experimental que intervino para decidir la “realidad” de este efecto, 


Pertenencia 


Además de las revisiones de las leyes del ejercicio y el efecto, varios términos 
nuevos entraron en el sistema teórico de Thorndike cuando éste lo revisó después 
de 1930. Uno de ellos —-la pertenencia—, por su reconocimiento de un principio or- 
ganizacional, fue una concesión a los psicólogos de la Gestalt. Según este princi- 
pio, una conexión entre dos unidades o ideas se establece con más prontitud si el 
sujeto las percibe en el sentido dé que se corresponden entre sí a se dan juntas. 
Por ejemplo, si la persona escucha una serie repetitiva de oraciones como: “Juan 
es un camicero, Luis es un carpintero, Carlos es un doctor”', etc., la asociación 
“camicero-Juan”* es mucho más poderosa que “'camicero-Luis”', a pesar de que 
““carnicero'* ocurra más cercano en el tiempo a “Luis” que a “Juan”. Obvia- 
mente, la persona percibe, agrupa y repite la corriente de palabras como construc- 
ciones de sujeto y predicado; su conocimiento de la sintaxis agrupa los vocablos 
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lo que dijo; esto es, el suceso E-R. Si recuerda “libro-eguivocado””, entonces no 
repetirá la conexión '“líbro-1”” (como muestran los datos de Tilton que aparecenen 
la figura 2.3). Si la persona olvida el eguivocado para libro, podría recordar inco- 
rrectamente, como un error de generalización, “posición serial 6 —corvecto””, 
porque ésta es muy similar a la posición serial 5. Si tal generalización o confusión 
se produce entre posiciones seriales adyacentes, la dispersión del efecto darla lu- 
gar a un factor de ejecución (en vez de un factor de aprendizaje, como Thorndike 
había interpretado). En esencia, esto equivale a una estrategia de “repita co- 
nexiones E-R que usted recuerde haber efectuado en un contexto que se aproxi- 
maba al de la posición serial 5'”. 

Esta hipótesis de generalización de posición acerca de la propagación tiene di- 
versas implicaciones. Primero, si en el ensayo 2 a los sujetos se les pide que re- 
cuerden la respuesta dada en el ensayo 1, y si ésta se consignaba como correcto o 
equivocado, la probabilidad de recordar la respuesta anterior es independiente 
de qué efecto siguió (correcto o equivocado), sin embargo, hay una generalización de 
la propagación al recordar consecuencias, como el hecho de que los pares califi- 
cados como equivocado pero en proximidad a un par al que se le adjudicó correcto, 
posiblemente se recuerde después como correcto; lo contrario sucede con un par 
calificado como eguivacado rodeado de pares denominados correcto (veáse Nuttin, 
1949, 1953). Esto es exactamente lo que cabría esperar de acuerdo con la teoría 
de la generalización. 

Además, la magnitud de la propagación del efecto se reduce notablemente si los 
estímulos que se presentaron en el ensayo Z tienen un orden serial nuevo y des- 
igual, Zirkle (1946) descubrió que la propagación del efecto se elimina al mezclar 
los elementos de la lista de prueba; la tendencia a dar una R a un £ que ha apare- 
cido cerca de una conexión ““E-R correcta”? no se incrementa a no ser que el E se 
repita en la misma posición serial. o en una cercana, como ocurrió en el ensayo 1. 

En el ejemplo anterior se emplea una lista breve y se adopta un patrón fortuita 
de asociaciones para explicar la propagación del efecto; con listas extensas estos 
[actores tendrán menos efectos. Pero debe comprenderse que ia propagación del 
efecto era, en el mejor de los casos, pequeña (véanse nuevamente las figuras 2.3 y 
2.4). Así, la atracción de un tema teórico crítico queda ilustrada por el gran esfuer- 
zo experimental que intervino para decidir la ““realidad'” de este efecto. 


Pertenencia 


Además de las revisiones de las leyes del ejercicio y el efecto, varios términos 
nuevos entraron en el sistema teórico de Thorndike cuando éste lo revisá después 
de 1930. Uno de ellos —-la pertenencia—, por su reconocimiento de un principio or- 
ganizacional, fue una concesión a los psicólogos de la Gestalt. Según este princi- 
pio, una conexión entre dos unidades o ideas se establece con más prontitud si el 
sujeto las percibe en el sentido dé que se corresponden entre sí o se dan juntas. 
Por ejemplo, si la persona escucha una serie repetitiva de oraciones como: “Juan 
es un carnicero, Luis es un carpintero, Carlos es un doctor'”, etc., la asociación 
*camicero-Juan'* es mucho más poderosa que ““carnicero-Luis'”, a pesar de que 
“carnicero”? ocurra más cercano en el tiempo a “Luis'” que a “Juan''. Obvia- 
mente, la persona percibe, agrupa y repite la corriente de palabras como constnuc- 
ciones de sujeto y predicado; su conocimiento de la sintaxis agrupa los vocablos 
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de una forma distinta de la que corresponde a su contigúidad temporal, y asigna el 
predicado de una oración al sujeto de la misma en lugar de adjudicarlo a la siguien- 
te. Hay cientos de ejemplos del funcionamiento de este principio que ilustran la 
manera en que algunas variables perceptuales (como la proximidad temporal o es- 
pacial) determinan qué unidades se repetirán y se percibirán juntas y, en conse- 
cuencia, cuáles se conectarán. Thorndike reconocía este factor de pertenencia 
pero no fue muy explícito en torno a la forma en que el mismo se ubicaría en su sis- 
tema mecanicista. Ñ 

Otra aplicación de la pertenencia que Thorndike reconocía era que la respuesta 
o castigo que sigue a un suceso de estímulo y respuesta debería percibirse como 
“'perteneciente”” a ese evento E-R, o que la persona la interpretara como si es- 
tuviese relacionado cun su respuesta. Por ejemplo, si durante el aprendizaje de 
una asociación pareada el sujeto de pronto recibiera del experimentador una gran 
retribución acompañada de una observación poco pertinente como: “Éste es el sa- 
lario que ¡ba a pagarle””; o si el sujeto sufriera una descarga eléctrica y el investi- 
gador le dijera: “oh, perdón, fue una falla de mi equipo”, esas recompensas 0 cas- 
tigos no se considerarían contingentes a la respuesta de la persona. Por lo tanto, la 
respuesta que antecede a tal efecto secundario sin pertenencia no tendrá gran- 
des alteraciones en su conexión asociativa debido a esa experiencia. Evidente- 
mente, estos efectos de pertenencia se relacionan con la forma en que el sujeto 
percibe o agrupa unidades que han de repetirse como una unidad de asociación. 


Polaridad asociativa 


Aunque el principio de la pertenencia puede interpretarse como una especie de 
concesión, el principio de la polaridad retaba a los principios de la Gestalt (1932a, 
pág. 158). El principio de la polaridad, de Thorndike, estipulaba que las conexiones 
actúan con más facilidad en la dirección en la cual se formaron que en el sentido 
opuesto. Si aprendemos determinado vocabulario alemán sujetándonos a prue- 
ba siempre en la dirección alemán-español, es probable que fracasemos en la di- 
rección español-alemán. El principio de la polaridad, de Thorndike, establece que 
las asociaciones pueden ser unidireccionales entre dos términos en vez de ser ne- 
cesariamente bidireccionales. Comparaba este principio con el de la simetría aso- 
ciativa (que atribuía a la teoría de la Gestalt), según el cual un par de elementos 
conectados forman un nuevo todo o unidad. De acuerdo con esta premisa, como la 
clave de recuerdo revive la huella completa, no tiene sentido decir que puede exis- 
tir una asociación en una dirección pero no en la otra. 

El problema de la simetría asociativa es aún actual entre los investigadores con- 
temporáneos del aprendizaje humano. Al parecer, su resolución depende de: a) la 
modalidad de repetición del sujeto; Merryman (1969) demostró que se les puede 
inducir a repetir pares asociados de tal modo que formen asociaciones fundamen- 
talmente unidireccionales o bidireccionales, lo cual depende de lo que tales sujetos 
piensen acerca de la manera en que usarán sus conocimientos del par durante los 
ensayos de prueba; y 5) la disponibilidad de dos unidades como respuestas re- 
cordables (Horowitz et al., 1966). Si nos aseguramos de la familiaridad de una per- 
sona con cada unidad, y especificamente de su habilidad para recordar la unidad 
por sí sola, cuando se le dé el otro miembro clave del par asociado, su recuerdo 
de esa unidad será notoria. Al tener en cuenta los métodos de repetición normal de 
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los sujetos, los dos elementos del par tenderían a mostrar la simetría asociativa 
según el grado en que ambas unidades fueran igualmente asequibles como res- 
puestas per se. Por ejemplo, en nuestra ilustración del alemán y el español la per- 
sona de habla española estará más familiarizada con la palabra perteneciente a su 
idioma que con la alemana, y por ello su recuerdo en las dos direcciones parece 
asimétrico. Sin embargo, según Horowitz y colaboradores (1966) esto sólo se 
debe a la diferente disponibilidad de las palabras correspondientes a cada una de 
esas dos lenguas. 


Identificabilidad del estímulo 


En todos sus escritos teóricos, Thorndike siguió identificando factores signi- 
ficativos en el aprendizaje e informando de nuevos experimentos que demostraban 
la importancia de los mismos. Dos factores que vale la pena mencionar son sus no- 
ciones de tdentificabilidad del estimulo y disponibilidad de la respuesta, ya que am- 
bas se relacionan estrechamente con los estudios contemporáneos. El principio de 
identificabilidad consiste en que una situación se conecta con facilidad a una res- 
puesta al grado de que la sitración es identificable, distinta y distinguible de otras 
en una serie de aprendizaje. Thorndike reconoce aquí el tema de la discriminación 
del estímulo, o aprendizaje perceptual, que desempeña un papel fundamental en 
las subsecuentes teorías del aprendizaje por asociación. Se refiere a la identifi- 
cación del estímulo en los siguientes términos: 


El aprendizaje como un todo incluye cambios en la identificabilidad de las situaciones, 
así como en las conexiones que llevan de ellas a las respuestas. ... Los elementos de las 
situaciones que resultan difíciles de identificar porque constituyen cualidades o carac- 
terísticas ocultas se analizan en relieye, y se vuelven identificables al hacer que la atención 
se dirija específicamente a ellas, y mediante la acción de concomitantes y contrastes va- 
riables (1931, págs. 88-39). 


Thorndike admitía así la importancia del reconocimiento del estímulo en la for- 
mación de asociaciones; también describía los medios típicos a partir de los cuales 
se abstrae la característica distintiva relevante de una serie de patrones complejos 
de estímulo; es decir, mediante la variación de las características irrelevantes y al 
contrastar las apariencias de la característica de relevancia a lo largo de muchos 
ensayos. Ciertamente, estas ideas tienen un matiz muy moderno. 


Disponibilidad de la respuesta 


Considérese ahora el principio de la disponibilidad como el tener a mano la respuesta, lo cual 
significa que si todo lo demás permanece constante, las conexiones son fáciles de formar 
de acuerdo con el grado de disponibilidad de la respuesta a su evocación, de moda que la 
persona puede tenerla o darla a voluntad (1931, pág. 89). 


El tipo de distinción que Thorndike tenía en mente era que algunas respuestas 
se sobreaprenden como actos familiares (por ejemplo, tocarnos la nariz o los de- 
dos de los pies) que se ejecutan con prontitud si se ordenan, mientras que los mo- 
vinnentos que requieren de una habilidad más perfeccionada (por ejemplo, trazar 
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una línea de 10 centímetros en contraposición a una de 7 centímetros teniendo los 
ojos vendados) tal vez no se recuerden con tanta facilidad. En este punto, 
Thorndike reconocía lo que ahora denominamos diferenciación de respuesta: la fa- 
cilidad con la cual una persona distingue dos o más respuestas que han de parearse 
con los estírmilos correspondientes. Las expresiones disponibilidad de respuesta o 
aprendizaje de respuesta se utilizaron en la bibliografía posterior para referirse a la 
adquisición de una cadena compleja de elementos; por ejemplo decir la secuencia 
“HXDFR”' a una señal particular, o escribir la palabra alemana arfgang como el 
equivalente de '*salida"* en español. 


THORNDIKE Y ALGUNOS TEMAS CONTEMPORÁNEOS 


Para observar en perspectiva la contribución de Thorndike es útil examinar dos 
tendencias contemporáneas de la investigación relacionadas específicamente con 
las posiciones de este autor. Consideraremos algunas interpretaciones modernas 
de la ley del efecto en cuanto a su aplicación al aprendizaje humano, y el tema del 
aprendizaje sin “darse cuenta”. Las opiniones de Thomdike acerca de estos te- 
mas estimularon muchas teorizaciones y experimentaciones sistemáticas. En 
nuestra opinión, el tiempo y el curso que tomó la evidencia científica no fueron fa- 
vorables a las posiciones iniciales de Thomdike; sin embargo; aunque teóricos 
posteriores hayan discrepado en lo que toca a sus premisas, debe reconocerse 
que en el mundo de ha ciencia la crítica es la forma más elevada de lisonja. Raras 
veces las teorías insignificantes suscitan controversias: sencillamente se las igno- 
ra y se les deja morir en la oscuridad. 


Hipótesis recientes acerca del efecto 
en el aprendizaje humano 


Aunque en reiteradas ocasiones Thorndike demostrá el papel de los efectos se- 
cundarios sobre el aprendizaje humano, no fue bastante afortunado como para ca- 
lar más hondo y explicar de qué forma la recompensa ejerce una influencia de for- 
talecimiento sobre una conexión E-R. Por temperamento se oponía a la idea de 
que el sujeto ““meditara'” sus pasadas experiencias de recompensa £-R, y deci- 
diera de modo consciente cómo responder a esa situación en el ensayo siguiente. 
Para el gusto de Thomdike, ese enfoque tenía un tinte muy evidente de especu- 
lación no científica, 

Sorprendentemente, las hipótesis acerca de las recompensas en el aprendizaje 
humano que hoy parecen estar más en consonancia con los hechos, fueron formu- 
ladas con claridad por el mismo Thorndike. Sin embargo, él las rechazó mediante 
argumentos que, vistos en retrospectiva, parecen falaces. Á estas interpretaciones 
alternativas acerca de por qué los efectos secundarios fortalecen las conexio- 
nes E-R, Thomdike las llamó hipótesis de repetición e hipótesis ideacional (o infor- 
imativa). La hipótesis de la repetición se formuló en estos términos: 


La otra doctrina o hipótesis a considerar es que cuando a una cierta conexión sigue un 
satisfactor, el individuo interesado rep.te la conexión o algo más o menos equivalente. Así 
fortalece él mismo las conexiones correctas mediante la repetición. Sencillamente, puede 
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descartar las conexiones equivocadas, otal vez fortalezca sus negativas como si se dijera: 
cuatro líneos cruzadas; no girar la cabeza a la zzquierda (1931, pág. 51). 


La actual investigación acerca del aprendizaje humano brinda un gran apoyo a 
esta hipótesis de la repetición diferencial, especialmente en situaciones de apren- 
dizaje en las cuales al sujeto se le presentan muchos elementos por aprender, y 
que varían en importancia o en valor, Por ejemplo, a la persona se le podría pre- 
sentar un cierto número de pares asociados para su estudio, y decirle cuánto dinero 
recibiría por cada uno si los recuerda en una prueba posterior en la que se le presen- 
te uno de los reactivos. En tal situación, el recuerdo varía en proporción directa 
con el salario esperado por recordar cierto elemento, Sin embargo, al parecer 
esto se debe en gran parte a un mayor tiempo de repetición que el sujeto asigna a 
los reactivos de remuneración elevada, en detrimento de aquellos mal pagados 
(Atkinson y Wickens, 1971). Si la persona ejerce un control estratégico sobre qué 
elementos entran en —o se suprimen de— un pequeño conjunto de reactivos que 
pasan por la repetición activa a medida que ka lista de pares se presenta serialmen- 
te, entonces los reactivos de retribución elevada tienen prioridad para permane- 
cer en el conjunto de repetición activa. Se dice que esta repetición es la variable 
causal que promueve el mejor aprendizaje de los reactivos de valor elevado. Así, 
el volumen de la recompensa no influiría directamente sobre el aprendizaje sino 
que lo haría a través de la instigación de más o menos repetición de reactivos de 
acuerdo con el valor que se les asigna, 

Se ha encontrado un efecto similar para la memoria de reconocimiento simple de 
pinturas aisladas (escenas naturalistas). Éstas se presentaron como pares de estudio, 
en los cuales cada uno de dichos cuadros tenía asignado diferente valor monetario 
(Loftus, 1972). Por ejemplo, en cierto par de cuadros la pintura de la izquierda 
podía valer 9 puntos y 3 la de la derecha; éstos eran los puntos a ganar si el sujeto 
reconocía más tarde este cuadro en un conjunto de pinturas similares. Como era 
de esperar, en una prueba de reconocimiento Loftus descubrió que los cuadros de 
mayor valor se recordaban mejor que los de valor inferior. Por otra parte, los re- 
gistros de los correspondientes movimientos oculares a medida que el sujeto es- 
tudiaba el par de cuadros durante 3 segundos arrojaron interesantes datos, La va- 
riable significativa resultó ser el múmero de fijaciones de la vista en un cuadro 
dado. 

La memoria de reconocimiento posterior aumentaba directamente en relación 
con el número de fijaciones de la mirada sobre el mismo cuadro durante el en- 
sayo de estudio. En promedio, las pinturas de valor recibían más fijaciones ocula- 
res. Sin embargo, una vez que el número de fijaciones de la mirada se mantenía 
constante, no había ningún efecto residual notabie sobre la memoria del valor mo- 
netario, en otras palabras: para todos los cuadros que recibían, por ejemplo, seis 
fjaciones de la mirada, la memoria de reconocimiento posterior de la persona era 
igualmente buena, con independencia de cuántos puntos valía esa pintura. La con- 
clusión es que el valor monetario afecta a la memoria sólo por la intermediación de 
la cantidad de procesamiento visual del cuadro. Este fenómeno es análogo al de la 
repetición de materiales verbales. 

Así, las recompensas (previstas o entregadas) indudablemente actúan sobre el 
aprendizaje humano al promover una exposición diferencial y una repetición de las 
conexienes a aprender, Desde luego, Thorndike no lo negaba: 


56 Primera parte. Teorias asociacionistas 


Tal fortalecimiento por repetición ocurte, pur supuesto, en muchos actos de aprendiza 
je. Todos debemos admitirlo. La cuestión estriba en saber si es el método esencial y ge- 
neral mediante el cual los satisfactores y las molestias que siguen a las conexiones las for- 
talecen o las debilitan, o si sólo se trata de un procedimiento accesorio u ocasional (1931, 
pág. 51D). 


A partir de la consideración de diversos experimentos, en los cuales las recom- 
pensas tenían los usuales efectos positivos pero impedían que el sujeto ejecutara 
una gran repetición consciente después de la recompensa, Thorndike concluyó 
que la repetición diferencial no era un aspecto esencial O necesario para deter- 
minar la influencia de las recompensas. En este punto debemos coincidir con él: 
percibimos efectos de la recompensa incluso cuando se impide la repetición dife- 
rencial, aunque el permitirla magnifica-los efectos observados. El problema res- 
tante se refiere a cómo interpretar tales efectos de la recompensa, aquellos que 
se encuentran cuando la repetición se reduce al mínimo o se iguala entre las con- 
diciones. A continuación examinaremos la hipótesis de la información. 


La hipótesis de la información y los efectos 
secundarios 


La información de Thorndike presuponía que los satisfactores actúan directa- 
mente para fortalecer las conexiones E-R a las cuales siguen. La alternativa prin- 
cipal a la hipátesis de Thorndike supone que los eventos en la secuencia estímulo- 
respuesta-consecuencia pueden recordarse en virtud de que ocurren juntos (con 
*'pertenencia”*), y que la mernoria que la persona tiene de la consecuencia recom- 
pensada o castigada hace que el siguiente ensayo ejecute la misma respuesta o la 
altere según quiera o no la misma consecuencia. Este punto de vista expuesto a 
grandes rasgos en la sección anterior en ocasión de examinar la propagación del 
efecto fue definido por Buchwald (1967, 1969) y por Estes (19694). Como lo de- 
muestran las siguientes líneas, Thorndike ya lo había considerado: 


La primera de estas teorías declara que [los efectos secundarios influyen en las cone- 
xiones] al recordar ideas propias o equivalentes. Por ejemplo, en nuestros experimentos 
relacionados con la elección del significado correcto de una palabra (en el aprendizaje de 
un vocabulario extranjero), la persona tería estas experiencias: veía la palabra A, 
respuesta 1, y escuchaba ““equivocado'”; miraba la palabra A, respuesta 2, y escuchaba 
*“*equivocado*”; veía la palabra A, respuesta 3, y escuchaba ““correcto'*. La siguiente vez 
que viera la palabra A, cualquier tendencia a dar las respuestas 1 0 2 evoraría en su mente 
alguna imagen, memoria o equivalente ideacional de ““equivocado””, mientras que cuale 
quier propensión a dar la respuesta 3 evocaría alguna imagen, memoria o equivalente 
ideacional de ““correrto””. Diría, además, que tales recuerdos o ideas de “'equivocado'* 
asociados con una tendencia deben inhibiría, y que tales recuerdos e ideas de ““correcto”' aso- 
ciados con una tendencia deben alentar su acción y, por lo tanto, preservaria y fortalecerla. 

Del mismo modo esta teoría ... explicaría el aprendizaje de un gato [en un laberinto en 
forma de 71, que termina por evitar la salida S en la cual recibe una ligera descarga eléc- 
trica, y favorece la salida F que conduce a la comida, mediante la suposición de que la ten- 
dencia a aproximarse y a entrar en S eyoca en la mente del gato alguna imagen o idea de la 
dolorosa descarga, mientras que la propensión a acercarse y a entrar en F evoca alguna 
representación del alimento, y que tales representaciones verifican y favorecen, respecti- 
vamente, estas tendencias (1931, págs. 47-48). 
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El primer párraío de esta cita abarca los aspectos esenciales de la actual teoría 
de Estes-Buchwald acerca de la manera en que opera la recompensa en el apren- 
dizaje humano; el segundo contiene la hipótesis a la que Kenneth Spence y Clark 
Hull se suscribieron en sus últimos escritos (véase capítulo 5), según la cual las 
respuestas se seleccionan por la expectativa de recompensas o castigos que traen 
como consecuencia, 

Una vez formulada esta teoría ideacional de los efectos secundarios, Thorndike 
la rechazó con base en tres argumentos que, vistos desde la perspectiva actual, 
parecen inadecuados, Primero afirmó que sus sujetos raras veces informan intros- 
pectivamente haber recordado las menciones de correcto o de equivocado que hacía 
el experimentador en los ensayos anteriores, Pero es probable que Thorndike no 
hubiera recabado datos sistemáticos acerca de tales cuestiones, y se basara sólo 
en informes de voluntarios, a menudo poco confiables. Experimentos más recien- 
tes en los cuales se les pide a los sujetos que recuerden primordialmente las con- 
secuencias, así como que den respuestas correctas, han comprobado un recuerdo 
apreciable de las consecuencias (Allen y Estes, 1972). 

En segundo lugar, Thorndike argumentaba que algunos movimientos aprendi- 
dos y especializados ocurren con tanta rapidez que sencillamente no habría bastan- 
te tiempo para evocar una imagen de la consecuencia antes de activar la respuesta 
(por ejemplo, un boxeador que propina un golpe corto con la izquierda a través de 
una apertura momentánea en la defensa de su contrincante). Sin embargo, la críti- 
ca no se sostiene si la teoría alternativa proporciona conexiones directas E-R que 
puedan activarse directamente al hacer un cortocircuito en la intervención deli- 
berada usual de los recuerdos E-C, La teoría de Estes tiene exactamente esa op- 
ción de cortocircuito disponible para manejar la ejecución de alta velocidad de los 
E-R habituales. En tercer término, Thorndike sostenía que la teoría ideacional es- 
peraba efectos simétricos de correcto versus equivocado, ya que cada uno de éstos 
constituía sólo un “estímulo informativo””, rmentras que el autor había descubier- 
to que egrivocado parecía tener un efecto mucho menor para debilitar las cone- 
xiuvnes, que el que eorsecto poseía para fortalecerlas. Pero la conclusión de 
Thorndike puede ser errónea: generalmente usaba una línea base inadecuada para 
computar los efectos de repetición (a línea base apropiada es la probabilidad de re- 
petición cuando la respuesta inicial del sujeto no va seguida de correcto ni de equei- 
vocado). Cuando se utilizaba la línea base adecuada los efectos de correcto y equivo- 
cado parecían más simétricos (véanse los resultados que obtuvo Tilton en las figu- 
ras 2.3 y 2.4). 

Después de haber examinado las críticas de Thorndike a la hipótesis informa- 
tiva, veremos a grandes rasgos algunos experimentos relacionados con el aprendi- 
zaje humano que al parecer apoyan dicha hipótesis, y que contradicen la interpre- 
tación de Thorndike, 


Experimento de información demorada, de Ruchwald 

En un ingenioso experimento, Buchwald (1967) comprobó una significativa dife- 
rencia entre el satisfactor y las teorías de información de la recompensa. Consi- 
dérese el experimento estándar de dos ensayos, de Thorndike, en el cual se pre- 
sentan palabras y el sujeto acierta números, como vimos en la tabla 2.1. Algunos 
sujetos de Buchwald recibían una retroalimentación inmediata de correcto o eguivo- 
cado después de cada evento E-R en el ensayo 1. Sin embargo, con otros sujetos 
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se usó un procedimiento novedoso: en el ensayo 1 conjeturaban acerca de cada 
palabra estímulo, y en ese momento no se les mencionaba correcto ni equivocado. 
Pero en la prueba del ensayo 2 que se llevaba a cabo algunos minutos después, 
cuando se les mostraba una palabra estímulo se les decía: “La respuesta que us- 
ted dio a esta palabra en el ensayo anterior era correcta (o eguivocada)””. Enton- 
ces, los sujetos respondian en el ensayo 2. Á este procedimiento se le conoce 
como condición de información demorada. 

De acuerdo con el análisis de Thorndike, se espera que los sujetos que reciben 
retroalimentación inmediata por su respuesta en el ensayo 1 muestren mayores 
cambios en la probabilidad de respuesta que aquellos que reciben información muy 
demorada. Según Thorndike, el satisfactor o la molestia debía ocurrir justo des- 
pués de la conexión E-.R para influir sobre su fuerza, Pero el análisis de Buchwald- 
Estes predice el resultado opuesto: los sujetos que reciben información demorada 
deben mostrar mayores cambios en las probabilidades de repetición de la respues- 
ta —puesto que se les dice correcto o eguivocado—, que quienes reciben retroali- 
mentación inmediata. 

Para entender este razonamiento, considérese un caso en que la palabra estí- 
mulo es cielo. La respuesta del sujeto es 4 e inmediatamente el experimentador 
dice equivocado. Las posibles asociaciones formadas aquí son cielo-4, cielo-equivo- 
cado y 4-equivocado (esta última es inútil, ya que con el número generalmente 
elevado de reactivos cualquier respuesta específica como *'4'* a menudo sería co- 
rrecta o equivocada). En el ensayo siguiente, a fin de mostrar un efecto de equivo- 
cado para reducir la repetición de cielo-4, la persona tuvo que recordar cielo-4 y 
cielo-equivocado, y usar esta última para evitar dar la respuesta 4 a cielo, Confor- 
me el grado en que el sujeto bajo la condición de retroalimentación inmediata olvi- 
de la asociación cielo-equivocado, repetirá cielo-4 según la probabilidad de la línea 
base. Consideremos ahora un caso con información demorada: el sujeto recuerda 
que dijo 4 para cielo en el ensayo 1 y, antes de que responda en el ensayo 2 se le 
dice que su respuesta anterior era equivocada. Por consiguiente, puede inhubir la 
respuesta 4 para cielo. Es claro que el sujeto de información demorada sólo re- 
quiere recordar su asociación anterior E-R para inhibir esa.R, mientras que el su- 
jeto en la condición de retroalimentación inmediata necesita recordar tanto su aso- 
ciación anterior E-R como la asociación E-C del ensayo anterior para inhibir la 
respuesta a ese estímulo. Como deben recordar más a fin de rechazar 4 para cielo 
en el segundo ensayo, se espera que los sujetos con retroalimentación inmediata 
muestren menos efectos por correcto-equivocado que los sujetos con información 
demorada. 

Los resultados del experimento de Buchwald (1967) y de una réplica (Estes, 
19694) confirmaron las predicciones del análisis informativo: la repetición de la 
respuesta del ensayo 1 se incrementaba para la condición correcto-demorado, más 
que para la condición correcto-inmediato, mientras que la repetición se reducía más 
para la condición equivocado- demorado que para la eguivocado-inmediato. La con- 
clusión conduce a una fuerte confirmación de la hipótesis de la información, 
contraria a la interpretación que Thorndike efectúa acerca de los satisfactores en 
el sentido de que se graban directamente en las conexiones E-R a las que Siguen. 


El experimento de “nunca-correcto”, de Estes 
En el experimento típico de aprendizaje por ensayo y error, los eventos de estí- 
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mulo, respuesta y recompensa por lo general ocurren de forma simultánea; asi, el 
aprendizaje de la unidad E-R y el de la unidad £-R-C se entremezclan intrincada- 
mente, Estes ideó una situación “en la cual el sujeto podía aprender relaciones 
entre combinaciones de estímulo y respuesta y valores de recompensa sin ninguna 
posibilidad de efecto directo de fortalecimiento del último sobre el primero” (Es- 
tes, 1969, pág. 75). En este experimento, a los sujetos se les muestran ocho pa- 
res de sílabas sin sentido en ensayos repetidos; dentro de cada par, una silaba (de 
lara la p, en la tabla 2.2) tiene un valor de cero, mientras la otra (de la q a la h) vale 
un cierto número de puntos (1, 2, 3, 4) si es elegida. Las diversas asignaciones se 
muestran en la tabla 2,2, donde las sílabas se representan con letras del alfabeto. 
Las sílabas e hasta p se entienden con facilidad; están pareadas de modo uniforme 
con 1, 2, 3, 4, o cero puntos, respectivamente, como sé indica en la tabla. Ahora 
bien, para ganar el número indicado de puntos de recompensa el sujeto tiene que 
seleccionar primero la sílaba correcta (en contraste con la opción de cero puntos 
en cada par), e indicar de forma correcta cuántos puntos vale la sílaba elegida. Por 
ejemplo, en un ensayo típico, la slaba f (con valor de 2 puntos) se presenta junto 
con la sílaba n (valor de cero puntos), la persona puede recibir dos puntos sólo si 
escoge f y señala que ésta vale los dos puntos; cualquier otra secuencia (por 
ejemplo, f y mencionar que vale tres puntos) se castiga al no asignarle singún pun- 
to, El valor correcto de la sílaba elegida siempre se muestra al final del ensayo. Es 
obvio que este procedimiento induce al sujeto a aprender la retribución asociada 
con cada sílaba. 

Junto con estas sílabas de retribuciones uniformes, Otros cuatro estímulos, q, b, 
c y d, tienen dos diferentes valores de puntuación asociados, como se indica en la 
tabla 2.2. Paralos estímulos “aleatorios” a y b, el experimentador decidía con an- 
telación decir uno u otro valor en una parte de los ensayos escogida al azar, inde- 
pendientemente de los aciertos del sujeto; en promedio, una vez que el sujeto 
aprendiera los dos valores asociados con las sílabas a y b, recibiría recompensas la 
mitad de las veces. 

Los reactivos críticos son los nunca correctos, c y d, a los cuales se les asigna 
también dos diferentes valores de puntuación. Por ejemplo, en una taneta de 


TABLA 2.2, Diseña del experimento de “nunca correcto”. Las letras representan 
distintas sílabas sin sentido, y los digitos representan los puntos 
rnonetarios asignados (tomada de Éstes, 1969). 


Valor Condición de Recompensa 
Estimulo asignado información en correcto 
a 1,2 Aleatorio 1,2 
b 3,4 Aleatorio 3,4 
Cc 1,2 Nunca correcto 10) 
d 3,4 Nunca correcto 0 
e 1 Uniforme 1 
f 2 Uniforme 2 
£ 3 Uniforme 3 
h 4 Uniforme 4 
INPC :) 0 Uniforme 0 
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prueba e contra *, si el sujeto escoge £ y acierta cualquier valor distinto de 1 o 2, 
no recibe puntos, y un valor de 1 o 2 se indica aleatoriamente como el valor co- 
rrecto del ensayo. Pero si el sujeto escoge e y acierta 1 punto, se dice que los pun- 
tos asignados en ese ensayo son 2; si el sujeto hubiese adjudicado 2 puntos a e, el 
experimentador habría dicho que 1 era el valor correcto para ese ensayo. En cual- 
quier caso, el sujeto no recibía recompensa en los ensayos al escoger e o d; sólo se 
le había hecho pensar que c y d, eran sílabas *“valiosas”” (en comparación con las 
silabas cero-uniformes), y que no había tenido suerte en acertar el valor correcto 
en estos ensayos particulares de entrenamiento. 

Se recordará que este procedimiento no ortodoxo se usó para evitar la usual 
confusión entre el aprendizaje de información acerca de qué consecuencias siguen 
a eventos dados E-R, y el efecto de fortalecimiento de esa consecuencia sobre la 
conexión E-R. Los eventos que rodean a la elección que el sujeto efectúa de los 
reactivos nunca correctos le proporcionan información acerca de posibles magni- 
tudes de recompensa, pero nunca le dan la ““satisfacción”” de recibirla. 

Se entrenó a los sujetos en esta ista de 8 reactivos hasta que concluyeron dos 
ensayos dedicados a escoger la sílaba correcta de cada par y anticipar su valor (o 
uno de sus dos valores). Un primer resultado que vale la pena señalar es que la 
tasa de aprendizaje (escoger la sílaba correcta) era la misma para las condiciones 
aleatoria y de nunca-correcto. Así la ““satisfacción”” de obtener puntos por la 
elección realizada no daba lugar a un aprendizaje más rápido de esa elección que el 
recibir información acerca de cuántos puntos se hubieran logrado en caso de haber 
acertado. Los resultados más críticos provienen de una serie de ensayos de prue- 
ba, en los cuales las sílabas empleadas en el entrenamiento se volvían a combinar 
en varios conjuntos de elección; se utilizaron los mismos puntos asignados, con la 
diferencia de que no se mostraban durante las series de prueba. A la persona se 
le indicaba que escogiera de modo de elevar al máximo los puntos a ganar, que sele 
adjudicarán al fina! de la serie de prueba. La variedad de los diferentes pares de 
prueba puede observarse en la tabla 2.3 junto con el porcentaje en una elección di- 
recta de par. La entrada marginal da la proporción promedio de tiempo en la cual 
se escogía el estímulo en juego sobre todos los elementos competidores con los 
que estaba apareado, 

La teoría de la información presupone que los sujetos seleccionan aquella opción 
que esperan conduzca a la mayor recompensa, lo que se mantiene con claridad 
para los reactivos uniformes (véanse las entradas marginales en la última colum- 
na); la frecuencia con que se escoge un reactivo (e hasta h) se incrementa en re- 
lación directa con el pago asignado, Incluso los reactivos aleatorios parecen decre- 
cer (en valor escogido) aproximadamente en el promedio de los valores de los 
reactivos uniformes correspondientes. 

Los datos significativos para la teoría de la información se refieren a la manera 
en que se tratan los reactivos nunca correctos —c y d— durante las series de 
prueba. El resultado importante es que al parecer los reactivos nunca correctos se 
comportan casi de la misma forma que los reactivos aleatoriamente recompensados 
con los mismos valores de puntuación. Por ejemplo, Á (3, 4) y NC (3, 4) tienen 
casi la misma primacía media, ninguno se prefiere más que el otro (véase el 0.56 
de la hilera 4, columna 2, donde 0.50 indicaría igualdad de predilección para las dos 
opciones). Se prefiere NC (1, 2) más que U, pero NC (3, 4) supera a NC (L, 2) casi 
en el primer grado que A (3, 4) supera a Á (1, 2). Por último, al promediar las dos 
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TABLA 2.3. Proporciones de elección de estímulos de hilera sobre estimulos de 
columna en el experimento de “nunca correcto”. Las entradas simétricas 
cerca de la diagonal principal suman 1.00. A se refiere a la retribución 
aleatoria. U a la retribución unilorme, y NC a reactivos nunca 
correctos (tomada de Estes, 1969a). 


Esti Condición 


mulo de recompensa a b € d e t g bh Promedio 
a A (1,2) — 002 061 0.05 085 019 0 0 0.25 
b A (3,4) 098 — 100 044 1.00 095 079 0.05 0.74 
c NC (1.2) 039 0 = 001 076 004 0 o 0.17 
d NC Bs) 095 0.56 099 — 0.95 092 0.74 0.01 0.73 
e ul 015 0 024 005 — 004 0 10) 0.07 
É 1094 0.81 0.05 0.9% 0.08 096 — o 001 0.41 
g U3 1.00 0.21 100 0.26 1.00 1.00 — 0.02 0.64 
h vs 1.00 0.95 1.00 0,99 1.00 099 098 — 0.98 


comparaciones de reactivos aleatorios con los nunca correctos, la preferencia me- 
dia es sólo de 0.52 para las condiciones aleatorias. Así, en todos los aspectos los 
sujetos parecen tratar a estas dos clases de reactivos como equivalentes en valor 
o enatractivo. 

Los datos de prueba que se presentan en la tabla 2.3 muestran que el valor de la 
recompensa es muy efectivo para producir diferencias sistemáticas en las respuestas 
seleccionadas; los sujetos eran muy sensibles a las variaciones relativamente 
pequeñas en tales valores de recompensa, Por lo tanto, la falta de una diferen- 
cia entre las condiciones aleatoria y la nunca correcta confiere mucha más cre- 
dibilidad al análisis informacional de los efectos de recompensa. Para los reactivos 
en ambas condiciones, el sujeto tenía igualdad de oportunidades para asociar los 
mismos valores de recompensas con la elección de la sílaba, El único aspecto que 
difería en las dos condiciones es que para los reactivos nunca correctos, los suje- 
tos en realidad nunca recibían el efecto secundario satisfactorio de alguna remu- 
neración. Así, la noción de '*satisfactores”” no puede invocarse para explicar un 
fortalecimiento directo de la elección del sujeto de una sílaba nunca correcta. El 
aprendizaje ocurre y las recompensas esperadas tienen su apropiada función 
selectiva en la ejecución, todo ello sin la ayuda de ningún efecto secundario directo 
y satisfactorio de una conexión recompensada. 

La conclusión del experimento reseñado, así como la que surge de otros estu- 
dios dirigidos por Estes (19692) es que la interpretación informativa (o ““ideacio- 
nal*”) de la ley del efecto posee un consistente apoyo. El aprendizaje de las asocia- 
ciones £-R, E-€ y R-C parece proceder independientemente de los valores de la 
consecuencia (CJ. El valor asignado a la consecuencia influye en ejecución; es de- 
cir, la expectativa de una consecuencia muy valiosa proporciona retroalimentación 
que intensifica la energía de una conexión E-R. La expectativa de no recompensa 
—o de castigo— para un estímulo proporciona retroalimentación inhibidora que 
bloquea o impide que la conexión E-R active la respuesta. Desde luego, una teoría 
así hace necesaria la existencia de algunas ideas acerca de qué tipo de consecuen- 
cias serán valiosas o cuál es la causa de que cambien sus valores relativos, depen- 
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diendo del estado del sujeto. Por lo general, estas cuestiones suelen estudiarse 
bajo el rubro de *"motivación””. 

Aunque los datos que conárman la hipótesis de la información se han presentado 
sólo en experimentos relacionados con el aprendizaje verbal humano, se presume 
que puede aplicarse un análisis similar a los efectos de la recompensa y el castigo 
en experimentos de condicionamiento con animales (véase la cita anterior de 
Thorndike, en la cual se estipula la hipótesis ideaciona)). En realidad, muchas teorías 
del condicionamiento instrumental (operante) realizan este mismo análisis de 
los efectos de la recompensa (por ejemplo, Logan 1960; Mowrer, 1960; Spence, 

-1956). Supuestamente, la contigiidad de la experiencia (con “*pertenencia”*) entre 
un estímulo y una respuesta basta para fortalecer la asociación entre ambos; las 
recompensas y los castigos influyen sobre la ejecución de la respuesta instru- 
mental debido a que se les espera justo antes de la ocurrencia de la respuesta. 
Estas opiniones, a las que se ha llegado después de un cuidadoso examen de los 
datos experimentales, distinguen entre el aprendizaje (de una conexión E-R) y la 
ejecución: a grandes rasgos, entre saber cómo hacer algo y hacerlo en verdad. 

En la época en que Thorndike trabajaba, esta distinción entre aprendizaje y eje- 
cución no estaba totalmente establecida ni se consideraba como decisiva. Más 
adelante, Tolman (véase el capítulo 11) uno de los primeros teóricos importantes, 
adjudicó a la distinción entre el aprendizaje y la ejecución una posición central en 
las hipótesis acerca de la conducta aprendida. 


¿Aprendizaje sin ““darse cuenta”? 


Abordaremos un aspecto final que proviene de las opiniones de Thorndike y to- 
davía despierta la curiosidad de los experimentadores modernos. El tema se refle- 
re ala supuesta acción “'automática”” de una recompensa o de un castigo que influ- 
ye en la conexión E-R a la que siguen. Thorndike creía que los efectos 
secundarios ejercen su influencia de esta forma automática, que actúan para forta- 
lecer la conducta independientemente de que el sujeto tenga o no conocimiento 
consciente de la contingencia entre su respuesta y la consecuencia recompensan- 
te, La teoría ideacional —o informativa— parece más compatible con la opinión 
contraria de que los sujetos aprenderían a esperar consecuencias recompensantes 
para una respuesta y, por ende, alterarían sus ejecuciones de acuerdo con tales 
expectativas. 

Este tema se ha defendido más vigorosamente en los estudios del condiciona- 
miento verbal, En un experimento típico, al sujeto se le pide que realice alguna ta- 
rea verbal, como la de asociación libre, mencionar palabras sencillas o construir 
oraciones (empleando uno de seis pronombres que el experimentador proporciona 
conjuntamente con una lista de verbos). Por lo común, se pretexta alguna circuns- 
tancia irrelevante para provocar la cooperación del sujeta; por ejemplo, se le dice 
que el experimentardor está registrando contornos de entonación en la producción 
de diferentes combinaciones fonéticas. El investigador monitorea las palabras pro- 
nunciadas durante un tiempo, a fin de establecer una tasa de línea base para las 
producciones de un tipo dado, y entonces comienza con discreción a asentir con un 
bien o un sí, que indican aprobación cuando el sujeto dice un tipo particular de pala- 
bra (por ejemplo, un sustantivo de cualquier clase en plural). Por lo general, du- 
rante este periodo se incrementa la tasa o la probabilidad de que el sujeto pro- 
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duzca ejemplos del tipo de respuesta recompensada, En algunos experimentos, 
la contingencia de recompensa puede terminarse por un periodo, durante el cual la 
tasa de respuesta disminuye hasta la tasa de lnea base. Este experimento funda- 
mental se ha realizado en múltiples ocasiones con diferentes tipos de respuesta, 
diversas clases y programación de reforzadores después de las respuestas 
críticas, y con variaciones en las instrucciones, 

E) procedimiento en tales experimentos, de habla con fuidez normal, categorías 
de respuesta mal definidas y recompensas sutiles, discretas y simbólicas, no con- 
duce a niveles elevados de condicionamiento. En términos generales, al sujeto le 
resulta difícil aislar y ensayar los sucesos pertinentes £-R-C. Sin lugar a dudas, 
hay grandes diferencias individuales en la sensibilidad a las contingencias de refor- 
zamiento; algunos sujetos se condicionan con mucha facilidad mientras que otros 
no lo hacen en absoluto. Resulta que este grado de condicionamiento se corre- 
laciona muy bien con el “darse cuenta”” del sujeto medido con Sus autoinformes 
en un cuestionario administrado al concluir la sesión de condicionamiento. El 
cuestionario sondea el conocimiento que la persona tiene de lo que en verdad su- 
cedía en el experimento: *'¿Decía algo el experimentador? De ser así, ¿qué de- 
cía?; ¿cuándo?; ¿seleccionaba usted sus palabras de acuerdo con alguna regla de- 
terminada?; ¿cuál?; ¿por qué? ¿Notó que usted dijo ciertas palabras más que 
otras? Si es así, ¿por qué?, ¿le parecía a usted que el experimentador trataba de 
influir en lo que usted decía? De ser así, ¿cómo?"* Estas preguntas varían desde 
vagas generalidades hasta especificidades y detalles; de igual manera, los expe- 
nmentadores varían en el tipo y en el alcance de las preguntas. 

Para ilustrar la forma en que el “*darse cuenta”* de la relación entre respuesta y 
recompensa se relaciona con el alcance del condicionamiento verbal, en la figura 
2.5 se muestran resultados de un estudio de sustantivos en plural dirigido por 
DeNike y Spielberger (1963). Este grupo experimental se dividía con hase en las 
respuestas dadas al cuestionario posexperimental aplicado a sujetos que se dieron 
cuenta y a los que no. En la figura los datos de los dos grupos se presentan en 
trazos por separado. Los sujetos del g£4po control tan sólo producían palabras sin 
que el experimentador recompensara alguna respuesta, y mostraban una tasa 
base constante de producción de sustantivos en plural a lo largo del experimento. 

El aspecto significativo es el nivel elevado de condicionamiento de los sujetos 
que se dieron cuenta en contraste con su virtual ausencia en aquellos que no lo hi- 
cieron; estos últimos no difesían de los sujetos de control no reforzados. Resul- 
tados de esta índole sugiren que los sujetos tratan de averiguar qué sucede en ta- 
les experimentos, y si pueden obterner la hipótesis correcta (es decir, inferir que 
el experimentador dice '*bien'* cuando ellos mencionan un sustantivo en plural), 

e "'instruirán a sí mismos'' para producir sustantivos en plural si quieren que el 
experimentador apruebe su elección, Dulany (1968) formula más detalladamente 
esta hipótesis volitiva; en un artículo crítico, Brewer (1974) argumenta de manera 
convincente que todos los resultados del condicionamiento humano se explican 
mediante dicha hipótesis volitiva, 

La posición alternativa es que el aprendizaje humano puede ocurrir sin darse 
cuenta de las contingencias de reforzamiento, aunque tal vez no se trate de un cam- 
bio de ejecución tan notable como el producido por una autoinstrucción explícita 
para generar respuestas de una clase específica. Los que sustentan esta opinión, 
como Kanfer (1968), señalan la correlación casi perfecta entre los informes ver- 
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bales de quienes se dan cuenta y su nivel de condicionamiento, o destacan casos 
en los cuales las tasas críticas de respuesta cambian sin que en los autoinformes 
del sujeto aparezca un indicio de que éste se haya dado cuenta. Ásumen la posición 
de que la respuesta primaria (como mencionar sustantivos en plural) y los infor- 
mes verbales acerca de sí mismo han de considerarse como variables depen- 
dientes que se relacionan de modo funcional con un número de variables ex- 
perimentales, y que el aprendizaje concurrente de los dos tipos de respuesta 
(mencionan sustantivos y describir las contingencias de recompensa) podrían 
proceder independientemente, aunque ambas se relacionarían con las ismas va- 
riables experimentales. 

Un análisis más profundo revela que el paradigma del condicionamiento verbal 
no es adecuado para resolver el problema del darse cuenta y del aprendizaje, ya 
que la respuesta que normalmente habrá de influirse está bajo control **volitivo””, 
y en tanto que la respuesta y sus consecuencias son elementos que el sujeto 
está en posibilidad de observar. El tema se examina de modo más simple a par- 
tir de estudios en los cuales las respuestas o sus efectos no pueden atribuirse 
al darse cuenta, por la sencilla razón de que la acción misma (o su consecuencia) 
no es observable. Las primeras condiciones se dispusieron en experimentos con 
sujetos humanos realizados por Hefferline y sus colaboradores (Hefterline y Kee- 


Cap. 2. El conexionismo 65 


nan, 1963; Hefferline ef a/., 1959), y por Sasmor (1966). En estos estudios se de- 
mostró que las respuestas musculares muy pequeñas y no observables, como una 
tensión en un músculo del dedo pulgar que el experimentador detecta mediante 
amplificación electrónica, se modifican cuando se emiten para producir un refor- 
zador positivo (una retribución monetaria) o a fin de evitar un estímulo nocivo (la 
postergación de un ruido aversivamente fuerte). La frecuencia de esta respuesta 
no percibida se incrementaba y disminuía de forma apropiada durante el con- 
dicionamiento y la extinción; sin embargo, ninguno de los sujetos podía identificar 
verbalmente la respuesta exacta de conducta que producía esos reforzadores. Los 
sujetos estaban siendo condicionados sin que pudieran establecer claramente qué 
es lo que hacían para provocar la aparición del reforzamiento. 

Pero aún subsisten dificultades de interpretación. La hipótesis de la volición ex- 
plica tales resultados al señalar que aunque los sujetos a menudo no aciertan al dar 
la respuesta que causa la presentación de la recompensa, con frecuencia han ad- 
quirido algunas hipótesis correlacionadas que los hace alterar el movimiento perti- 
nente. Asílos sujetos que participaron en los experimentos de la pequeña tensión 
del dedo pulgar podrían creer que las retribuciones se entregaban por levantar un 
poco los hombros, o imaginar que iban a escribir una carta; estas actividades origi- 
narían cambios correlacionados en la tensión en los músculos de la mano, que el 
experimentador registra corno movimientos condicionados en miniatura. 

Ahora parece evidente que las dos opiniones no son tan distintas. Una vez que 
nos enfrentamos a los problemas de medir el darse cuenta, de especificar detalla- 
damente de qué forma los sujetos llegan a darse cuenta de (o a ser capaces de ver- 
balizar) las contingencias de reforzamiento, de determinar con exactitud la manera 
en que la descripción que se hacen a sí mismos de las contingencias de reforza- 
miento conduce al control de sus respuestas evidentes; una vez que todos estos 
temas se hayan estudiado y explicado parecerá que el £-R automático y la inter- 
pretación volitiva son muy sirrelares y que los diversos matices responden a distin- 
tos énfasis, Y esto no es extraño en la teoría psicológica. La cuestión de si las re- 
compensas influyen de una “manera inconsciente y automática” resulta ser una 
pregunta de investigación bastante mal estructurada que ha generado muchos ex- 
perimentos y relativamente poca luz. Desde luego, con este juicio no pretende- 
mos denigrar el valor del paradigma del condicionamiento verbal como un posible 
modelo de la forma en que el reforzamiento opera en todos los tipos de situaciones 
sociales que implican conducta verbal, como las entrevistas laborales, las consultas 
psiquiátricas, las encuestas de opinión, las pruebas mentales o de personalidad, 
y las sesiones psicoterapéuticas (véase Krasner, 1962). Por ejemplo, los estu- 
dios que ilustran la manera en que un psicoterapeuta refuerza y castiga selectiva- 
mente las observaciones efectuadas por el paciente —aunque a menudo ocurran 
de forma inconsciente— son significativos al revelar variables efectivas en la 
influencia interpersonal y en el cambio de actitudes dentro de la psicoterapia. 


Thorndike: un educador que amaba los hechos 


Thorndike impartió clases en una escuela especializada en educación donde se 
capacitaba a profesores, y por ello constantemente se enfrentaba al reto de usar a 
la psicología para explicar con mayor eficacia los métodos y políticas educativas. 
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Era un científico empírico por temperamento que, desalentado por los vagos te- 
mas filosóficos que rodean a muchas prácticas educativas, siempre que le fue posi- 
ble intentó presentar Jos temas de manera tal que permitieran tornar resoluciones 
basadas en los hechos. Por ejemplo, defendió las ideas de la medición educativa y 
de la clara enunciación de los objetivos educativos. 

Thorndike imprimió un gran impulso al movimiento científico en el campo de la 
educación, al propugnar que las prácticas educativas se regularan de acuerdo con 
los resultados verificados en situaciones específicas. Su formidable estímulo dio 
lugar a una nutrida producción en áreas tan variadas como las escalas de escritura 
a mano, la redacción de diccionarios, los métodos para la enseñanza de la aritmé- 
tica y de la ortografía, y las pruebas de inteligencia y orientación vocacional. Pero 
el secreto de su producción no residía sólo en la energía: provenía también de su 
concepción práctica de la ciencia, de la noción de que antes de intentar hacer algo 
en cualquier sentido, debemos saber específicamente qué es lo que buscamos, 

El enfoque de la especificidad nos ayuda a disponer el ánimo para comenzar a 
trabajar. Considérense, por ejemplo, todas las complicaciones que aparecen en la 
enseñanza de la lectura. ¿Qué se le va a enseñar al niño? ¿filología?, ¿gramática?, 
¿fonética? Thorndike propuso una respuesta simple: “palabras”. Y a partir de esa 
respuesta procedió a contar la frecuencia con que cada palabra se presenta en 
muestras de textos en inglés, mediante la tabulación de millones de vocablos es- 
crítos en todo tipo de fuentes. Así obtuvo los más comunes. Indudablemente, 
éstos son los que deben comprenderse. Compiló listas y compuso diccionarios 
para facilitar la enseñanza de las palabras más necesarias. Una teoría de la espe- 
cificidad como la de Thorndike le dice al educador dónde buscar y cómo medir en 
un campo tan desconcertante corno el de las prácticas en el salón de clases. 

El enfoque de la especificidad también es una fuente de desventajas, y ha sido 
objeto de los ataques más severos que sufriera Thorndike. La explicación anterior 
puede revelarnos los tipos de críticas que recibe: ¿está el lenguaje constituido sólo 
por palabras?; ¿son las palabras más frecuentes lo que en realidad deseamos ense- 
ñar? Tal vez debamos pensar en el lenguaje como un medio de expresión y, por lo 
tanto, equipar al niño con el mínimo conjunto de herramientas necesarias para una 
comunicación adecuada. Las posibilidades de este enfoque se han demostrado en el 
desarrollo del inglés básico, en el cual el vocabulario central de 850 palabras supe- 
rá, sólo en parte a las palabras más frecuentes de Thorndike. El enfoque del inglés 
básico tiene en cuenta el carácter organizado del lenguaje como instrumento para 
transmitir significado. Thorndike, fiel a la tradición de la asociación. tendía a consi» 
derarlo como una colección de palabras, a la que intentó tratar cuantitativamente. 
Como lo hacían todos los psicólogos de la época —y continuaron haciéndolo algún 
tiempo después-— Thorndike proporcionó sólo un análisis muy superáíicial e inade- 
cuado de la adquisición del lenguaje y de su funcionamiento. Parte de la revolución 
en la lingúística y psicolingúística modernas consiste en la demostración de com- 
plejidades en el lenguaje que van más allá de los más audaces sueños (o pesadillas) 
de los psicólogos conductistas. 

Los prejuicios objetivos y mecanicistas de Thorndike saturaron su concepción 
de las acciones de las recompensas y los castigos, y debilitaron un tanto su análisis 
de estos fenómenos. La noción de que la ley del efecto opera mecánicamente en 
todas las conexiones próximas a la recompensada sugiere que la recompensa afec- 
ta muchas actividades distintas de la deseada. Con la esperanza de demostrar que 
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la ley del efecto funcionaba de este módo, Thordike menospreció las relaciones in- 
ternas entre el éxito y aquello que el individuo intenta hacer; pasó por alto el he- 
cho de que la satisfacción depende mucho de los logros del aprendiz de acuerdo 
con su nivel de aspiración. Aunque se refirió al papel de las metas y de los intere- 
ses en el aprendizaje, Thorndike Jes asignó un estatus secundario; sus preocu- 
paciones científicas lo alejaron de las relaciones internas entre el esfuerzo y el éxi- 
to hacia la relación externa de cualquier recompensa rutinaria que fortalezca una 
conexión que esté próxima a ella. , 

Las opiniones de Thorndike acerca del papel del aprendizaje por “comprensión 
o discernimiento”” también han sido motivo de polémicas. Creía que la compren- 
sión se desarrolla a partir de los hábitos más tempranos, y la mejor manera de pro- 
gramar a los aprendices para que disciernan acerca de un problema nuevo consiste 
en enseñarles diversas conexiones pertinentes al problema. Thorndike afirmaba 
que cuando las condiciones se comprenden al momento, esa comprensión se pro- 
duce por asimilación, al responder a aquellos elementos quela nueva situación tiene 
en común con la antigua, donde los antiguos hábitos eran apropiados, Su subor- 
dinación del discernimiento y de la comprensión al adiestramiento y al hábito gene- 
ró muchas controversias en la educación. Aunque pensaba que el discernimiento 
era muy raro en Jos animales (tal vez más de lo que en verdad es) no lo negó en los 
seres humanos. Esto no le causaba admiración, y consideraba que se podía com- 
prender mejor mediante las mismas leyes de asociación que se aplican en otras si- 
tuaciones. Asj como las inferencias erróneas surgen debido a las asociaciones ha- 
bituales que logran sacar a los aprendices de su curso, también los discernimientos 
del genio se hacen mediante las asociaciones y las analogías habituales apropiadas. 
En lo que toca a la reacción frente a las situaciones nuevas, Thorndike aúrmaba: 


No hay una fórmula mágica mediante la cual la naturaleza del hombre actúe en un espasmo 
impredecible cuando se enfrenta a una situación nueva. Sus hábitos no se retiran entonces a 
una distancia conveniente mientras algunas entidades nuevas y misteriosas dirigen su conduc- 
ta. Por el contrario, los vínculos adquiridos con las situaciones antiguas se revelan Ln mayor 
seguridad enla acción cuando aparece una situación nueva (1913, pág. 29). 


Aunque este comentario es bastante verídico, el fracaso de Thorndike al describir la 
forma en que seutilizan los hábitos pasados en la solución de problemas, al considerar 
qué disposición de elementos dificultan un problema, cuáles lo hacen fácil o cuándo in- 
tervienen los mismos vínculos esenciales, constituye una genuina limitación. Y la dife- 
rencia es crucial para la práctica escolar. Por ejemplo, en este contexto es posible 
aprender primero combinaciones de números (establecer los ““vínculos'”), después 
obtener algún atisbo de comprensión de los conceptos acerca de los números, más 
adelante asimilan las operaciones aritméticas como la suma en términos de conjuntos, 
y por último aprender la multiplicación. Finalmente llegamos al mismo lugar: a cono» 
cer las tablas de rmutiplicación y a saber cómo emplearlas. Sin embargo, no podernos 
concluir que inevitablemente un método de enseñanza es más eficiente que el otro, ni 
para los estudiantes que saben con exactitud lo que se ha enseñado, ni para que sean 
capaces de aplicar ese conocimiento a nuevas situaciones. La preocupación de Thorn- 
dike por los vínculos ha dado Jugar a que recurramos a otros autores que no siguen sus 
lineamientos, a fin de examinar un enfoque más cuidadoso del papel del significado y 
de lacomprensión en el aprendizaje normal. 
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LECTURAS COMPLEMENTARIAS 


Thorndike fue un escritor prolífico; su bibliografía aparece en dos partes en el Teachers Coljege 
Record: durantelos años 1898 a 1940 en el volumen 41 (1940), páginas 699-725; en los años 1940 
a1949 enel volumen 51 (1949), páginas 42-45. En total, están publicados más de 500 artículos. 

Los libros siguientes son la mayor contribución de Thorndike a la teoría del aprendizaje, con 
ayuda de los datos experimentales: 


Thorndike, E.L., Animal intelligence, 1911. 

Thorndike, E. L., Educational psychology: The psychology of leaming, vol. 1, 1913, 
Thorndixe, E.L., The psychology of arithmetic, 1922. 

Thorndike, E. L., etal., Adult learminy, 1928. 

Thorndike, E. L., Human learning, 1931. 

Thomáóike, E. L., The fundamentals of learning, 1934. 

Thormndike, E. L., The psrcholozy of wants, interests, and attitudes, 1935. 
Thorndike, E, L., Selected wntings from a connechonist's psychology, 1949. 


También se recomienda la bibliografía siguiente de Thorndike: 


Jancích, G. , The sane positivist: A biography of Edward L. 
Thorndike, 1968. 
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El condicionamiento 
clásico 


de Pavlov 


El distinguido fisiólogo ruso Iván Petrovich Pavioy (1849.1936) fue el primero en 
estudiar experimentalmente los reflejos condicionados y el que les dio su nombre. 
Aunque no inició sus investigaciones sino hasta que tenía 50 años de edad, pasó el resto 
de su larga vida en el laboratorio, y finalmente llegó a tener a su cargo un equipo de 
investigación que incluía a más de cien profesionales y asistentes. Tanto dentro de la 
Unión Soviética como en el resto del mundo, su influencia sobre la teoría del aprendi- 
zaje ha alcanzado considerables proporciones. El prorrinente lugar que ocupan sus cor 
ceptos acerca de los reflejos condicionados en las teorías estadounidenses se pondrá 
de manifiesto en los siguientes capítulos, en los que se verán las opiniones de 
Guthrie, Skinner y Hull. 

Todos los estudiantes conocen el clásico experimento de Pavloy. Cuando se coloca 
un trozo de carne frente al hocico de un perro se produce la salivación: el alimento es 
el estímulo incondicionado (El), y la salivación el reflejo incondicionado (RE. Enton- 
ces algún estímulo arbitrario, por ejemplo una luz, se combina con la presentación del 
alimento, Así, después de la repetición y de las relaciones temporales correctas, la luz 
evocará la salivación independientemente del alimento: se ha convertido en un esfmu- 
lo condicionado (EC), y la respuesta a éste se denomina reflejo condicionado. Los psi- 
cólogos estadounidenses han tendido a emplear la expresión respuesta condicionada 
(RC) en lugar de reflejo condicionado, pero la diferencia enlos términos no es muy im- 
portante. 

Pavloy inició su carrera científica con investigaciones acerca de la circulación en el 
corazón, y posteriormente se dedicó al estudio de la fisiología de la digestión, que en 
1904 le valió el Premio Nobel. El trabajo esencial sobre los reflejos condicionados se 
inició en 1899 con la publicación de las tesis de Walfson, realizada bajo la dirección 
de Pavloy, y titulada “Observations upon salivary secretion”' (Observaciones acerca de 
la secreción salival) (Pavlov, 1927, pág. 412). A los reflejos recientemente descu- 
biertos se les denominó ““secreciones psíquicas”? para distinguirlos de las reacciones 
fisiológicas no aprendidas. Pavlov escribió dos libros acerca de este tema en los si- 
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gwentes veinticinco años; se tradujeron al inglés con los títulos Condittoned reflexes 
(1927) y Lectures on conditioned reflexes (1928). En ese entonces el científico rusa te- 
nía ya 75 años; sin embargo, a esa avarizada edad se interesó por la psiquiatría, y duran- 
te el resto de su vida realizó múltiples observaciones en hospitales para enfermos 
mentales, con la intención de encontrar algún paralelismo entre ellas y los experimen- 
tos con perros en laboratorio. Sus artículos posteriores fueron recopilados y publi- 
cados en diversos volúmenes. 


Antecedentes del condicionamiento 


La psicología experimental moderna se desarrolló bajo la influencia de la teoría de la 
asociación, la cual tenía sus orígenes en los trabajos de los filósofos empíricos ingleses 
Locke, Hobbes, Berkeley, Hume, Hartley y los Mill. Desde los tiempos de Aristó- 
teles, las leyes de la asociación generalmente se estipularon como aquellas relativas a 
Jacontigúidad temporal, la similitud y el contraste de los elementos por asociarse, Con 
el transcurso de los años, la asociación por contigúidad terminó siendo conside- 
rada como el principio primario, al que se le confería una aparente forma fisioló- 
gica, como podemos advertir en el párrafo siguiente: 


Cuando dos procesos cerebrales elementales han estado activos juntos o en sucesión 
inmediata, al volver a ocurrir uno de ellos tiende a propagar su excitación al otro (James, 
1890, 1,566). 


Si, como en este enunciado de William James, ponemos el acento en los eventos 
contiguos y estipulamos la asociación de los mismos como existente entre estados 
cerebrales, no estamos lejos de la concepción de Pavlov del reflejo condicionado. 

Los hechos fundamentales del condicionamiento se conocían antes de que al- 
guien intentara hacer lo que Pavlov; es decir, estudiar exactamente lo que ocurría 
y variar los parámetros que controlaban Jos sucesos. Así, Whytt reconoció la ““se- 
creción psíquica”? más de un siglo antes que Pavloy, 


Consideramos . .. que la remembranza o idea de las sustancias aplicadas con anterioridad 
a diferentes partes del cuerpo produce casi el mismo efecto que si estuviesen en verdad 
presentes. Ási, la vista o incluso la tdeg evocada de comida gratificante, origina un flujo de 
saliva poco corn en la boca de un persona hambrienta; y la visión de un limón puede pro- 
dncir el mismo efecto en muchas de ellas (1763, pág. 280, citado por Rosenzweig, 1962). 


LOS EXPERIMENTOS Y LAS TEORÍAS DÉ PAVLOV 
Algunas relaciones empíricas 


La contribución de Pavlov no consiste tanto en su descubrimiento del reflejo 
condicionado y en su teoría acerca de él, como en el cuidado con que exploró nu- 
merosas relaciones empíricas para determinar los parámetros esenciales y pro- 
porcionar el repertorio y la terminología para incontables experimentos. 


El reforzomiento, la extinción y la recuperación espontánea. 
La historia de un reflejo condicionado simple comienza con su adquisición a tra- 
vés del reforzamiento repetido; es decir, el seguimiento reiterado del estímulo 
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Figura 3.1. Curso de adquisición de una respuesta salival condicionada. La sali- 
vación se anticipa a la inyección de morfina, que sirve como estimulo incondiciona- 
do, Resultados promedios de cuatro perros (graficados por Hu!l (19346, pág. 4251 a 
partir de los datos de Kleitman y Crisler [1927)) 


condicionado por el estímulo y la respuesta no condicionados en intervalos tempo- 
rales apropiados. Pavlov presentaba datos que correspondían a perros ya condi- 
cianados, de modo que el curso de la adquisición original por lo general no figura 
entre sus datos. Sin embargo, experimentos similares demuestran que la adqui- 
sición de una respuesta condicionada sigue una curva en forma de S, la porción ini- 
cial de los ensayos tiene pocas o ninguna respuesta, en seguida hay un incremento 
rápido en las mismas, y después una disminución en la tasa de incremento. La cur- 
va que aparece en la figura 3.1 muestra la aceleración inicial, pero el experimento 
no se siguió durante el tiempu necesario para que ocurriese la desaceleración a 
medida que se logra un nivel asintótico de respuesta. 

Cuando el reforzamiento se retira y el estímulo condicionado se presenta solo, 
sin ir acompañado por el estímulo incondicionado, la respuesta condicionada dis- 
minuye gradualmente y desaparece, proceso que se denomina extinción expe- 
rimental. Pavloy publicó numerosas tablas que mostraban tal extinción. Los da- 
tos de una de ellas se proyectan en los trazos de la figura 3.2. Sin embargo, des- 
pués de algún tiempo transcurrido sin repetición de ningún tipo, la salivación 
condicionada retorna; a esto se llama recuperación espontánea del reflejo extin- 
guido. Más adelante veremos la explicación que Pavlov proporciona acerca de es- 
tos efectos. 
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Figura 3.2. Curso de la extinción y la recuperación espontánea. La disminución de la 
altura de las barras a la izquierda indica el decremento en la salivación condicionada 
a medida que el estimulo condicionado (la visión de polva de carne) se repite sin re- 
tforzamiento. La barra a la derecha muestra la recuperación espontánea después de un 
descanso de 20 minutos (tomada de Pavlov, 1927). 


Generalización del condicionamiento y extinción 

En el proceso del condicionamiento la respuesta termina por evocarse mediante 
una amplia gama de estímulos centrados en torno al estímulo condicional espe- 
cífico. En una prueba la RC ocurrirá ante un estímulo vecino en un grado que de- 
pende de la similitud entre el estímulo de prueba y el de entrenamiento. A esto se 
le denomina generalización del estimulo. En la figura 3.3 se muestra un ejemplo; 
en un estudio dirigido por Hovland (1937) se condicionó a los sujetos para que dieran 
una respuesta galvánica de la piel (RGP, sudoración de la palma de la mano) ante 
un tono, pareándolo con una descarga eléctrica. Después del entrenamiento, se 
sometió a prueba a los sujetos con tres tonos que variaban en frecuencia (timbre) 
y que se encontraban a diferentes distancias del EC de entrenamiento. Esta dis- 
tancia se medía registrando el número de diferencias apenas perceptibles (DAP) 
entre el EC y el estímulo de prueba. La figura 3,3 constituye una gráfica de los re- 
sultados; es decir, muestra una generalización en decremento del RC ante los es- 
tímulos tonales progresivamente distantes del EC de entrenamiento, 

No sólo existe generalización de una respuesta condicionada después del entre- 
namiento; también se produce una generalización complementaria de “ninguna 
respuesta” a raíz de la extinción. Aunque Pavlov fue el primero en descubrirlo, el 
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efecto se ilustra con mayor claridad en otra parte del experimento de Hovland 
(1937), que se muestra en la figura 3.4, En este caso, se condicionó primero a los 
sujetos mediante ensayos entremezclados para dar una RGP a la totalidad de cua- 
tro tonos de diferente frecuencia, Entonces, se presentaba repetidas veces sólo 
un tono extremo, sin descarga eléctrica, de modo que la RGP para ese tono se 
extinguía (o se inhibía, como diría Pavlov), De allí en adelante, a los sujetos se les 
sometía a prueba sin reforzamiento con los cuatro tonos, lo cual produjo los resul- 
tados que se presentan en la figura 3.4. En ella se muestra la amplitud más baja de 
respuesta para el estímulo extinguido (por encima del cero DAP), pero hay un de- 
cremento progresivamente menor (imhibición generalizada o no respuesta) cuanto 
más lejos se encuentre el estímulo de prueba del estímulo extinguido, 

Como veremos más adelante, Pavlov intentó explicar los fenómenos de gene- 
ralización en términos de la propagación (““irradiación””) de los efectos positivos 
del condicionamiento ('“excitación”*) en la corteza, entre los lugares de acción 
neural del EC y el estímulo de prueba. De modo similar, se decía que la generali- 
zación de los efectos de extinción para un estímulo reflejaba la propagación de la 
inhibición en torno al lugar cortical del estímulo extinguido. 


Diferenciación 

Una respuesta condicionada que se generalizara a una amplia gama de esti- 
mulos, sería muy inadaptada en situaciones que requieran de una reacción sensible 
sintonizada con precisión a los aspectos sutiles o críticos de una situación de esti- 
mulo. Por la tanto, la diferenciación, el proceso complementario de generaliza- 
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ción, tiene gran importancia adaptativa. Pavlov demostró en reiteradas oca- 
siones este proceso de diferenciación, al poner en evidencia la forma en que la 
generalización inicial a partir de un £C reforzado hacia un estímulo de prueba po- 
día vencerse contrastando los dos estímulos alternativamente en el transcurso de 
los ensayos. Es decir, el sujeto recibe una serie de ensayos alternados aleatoria- 
mente entre las presentaciones del EC positivo (denominado EC+) pareado con 
el estímulo incondicionado, y con los ensayos del EC negativo (lamado EC—) no 
pareado con el reforzamiento. Al final, después de algunas fluctuaciones el reflejo 
condicionado ocurre principalmente al EC= y poco o nada al EC--. El sujeto ahora 
discrimina entre el EC+ y el EC—, mientras que antes había generalizado su res- 
puesta condicionada entre los dos. Así como Pavlov discutía la generalización en 
términos de irradiación subyacente en la corteza, también concibió la diferen- 
ciación como la correspondiente concentración de excitación en el lugar cortica) 
EC+, y de inhibición en el lugar cortical EC—. 


Relaciones temporales favorables entre el EC y el El 


El condicionamiento depende de que el EC anteceda ligeramente al ET, u ocurra 
de modo simultáneo. Si el EC sigue al El (lo que se lama pareamiento hacia 
atrás), no hay un condicionamiento excitatorio (positivo), aunque tal vez pueda re- 
sultar alguno inhibitorio (negativo), dependiendo de arreglos experimentales pre- 
cisos. Cuando el EC antecede al EJ por varios segundos, puede terminar antes 
del EJ (el denominado procedimiento de *“huella'”); por lo común esto da lugar a 
un aprendizaje más pobre que sí el EC permanece junto con el EJ (el denominado 
condicionamiento ““demorado'”). En cualquier caso, luego de la adquisición la 
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respuesta condicionada comienza a aparecer después del EC y antes del El con 
una latencia proporcional al intervalo temporal entre ambos. Es decir, el sujeto 
aprende a retener su respuesta hasta un punto justo antes del E/. El alcance del 
condicionamiento varía en una función de U invertida con el intervalo EC-El. En 
la figura 3.5 se muestra una curva típica, teniendo en cuenta el número de res- 
puestas condicionadas durante una serie de ensayos de prueba no reforzados, 
después del entrenamiento en diferentes intervalos EC-El en gatos condicio- 
nados para contraer las patas delanteras. El EC era un tono y el EJ una descarga 
eléctrica en la pata delantera, lo cual provocaba la retracción. El intervalo óptimo 
para las respuestas esqueléticas rápidas y de fase, como el parpadeo o la flexión 
del pie, es generalmente de alrededor de medio segundo. Para las respuestas au- 
tomáticas corno la salivación o la RGP, el intervalo que causa el condicionamiento 
óptimo es más prolongado, entre 5 y 30 segundos, dependiendo de las condicio- 
nes, Las explicación de la función del intervalo EC-ET y su variación a lo largo de 
los sistemas de respuesta es una cuestión que las teorías han de señalar. 


Usos del concepto de inhibición 


Pavlov utilizaba el concepto de inhibición para referirse a cualquier decremento 
o pérdida en un reflejo condicionado. Identificó diversos factores de decremento, 
y a cada uno de ellos lo consideró una variante de la inhibición. La inhibición exter- 
na consistía en una pérdida temporal de una RC debida a un estímulo distractor 
extraño, como cuando un sonido de gran volumen distrae al animal y reduce la 
salivación condicionada ante un EC Juminoso. La torhibición interna es una forma 
aprendida de inhibición evocada por un estímulo pareado con no-reforzamiento, en 
circunstancias en las cuales el El se esperaría de otro modo. Por ejemplo, a con- 
tinvación del condicionamiento, si el EC se repite sin reforzamiento en el procedi- 
miento llamado extinción, Pavloy explica la disminución de la respuesta condi- 
cionada diciendo que ahora el EC produce inhibición interna del reflejo. Si un EC+ 
se parea con el reforzamiento, en contraste con un EC— alternativo presentado 
sin reforzamiento, se dice que el EC— se ha asociado con la inhibición interna. Si 
sólo el estímulo A se parea con el reforzamiento, y el compuesto de estímulos A + 
B se presenta sin reforzamiento, entonces el estímulo B se convierte en un 
inhibidor condicionado, lo cual significa que se ha asociado con la inhibición 
interna. Pavloy concebía la inhibición condicionada (interna) como una fuerza es- 
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pecífica de antirrespuesta dirigida a impedir que el EC+ provoque la respuesta 
específica (por ejemplo, la salivación o el parpadeo). Como se hizo notar, Pavlov 
también creía que la inhibición interna asociada con un estímulo se generalizaría a 
estímulos similares. 


Teorías de Pavlov acerca del condicionamiento 
cerebral 


Pavloy era un fisiólogo, y por ello al buscar explicaciones para los fenómenos del 
condicionamiento apeló con frecuencia a la “actividad nerviosa superior'*, con la 
cual se refería a los procesos fisiológicos dentro de la corteza cerebral. Un experi- 
mento inicial, en el cual se intentó el condicionamiento en un perro cuya corteza 
cerebral había sido removida, convenció a Pavlov de que los reflejos condicio- 
nados no podían formarse en ausencia de ella.? 

Aunque se realizaron diversos experimentos de lesión cerebral y se recono- 
cieron algunas localizaciones anatómicas de la función, los principales procesos fi- 
siológicos que describía Pavloy constituyen inferencias a partir de la conducta, y 
no el resultado de estudios directos de centros particulares. Por ejemplo, cuando 
se mencionaba el “analizador visual”” o el **analizar auditivo'* se les asignaban ubi- 
caciones anatómicas vagas, y sus propiedades se inferían principalmente por los 
tipos de discriminaciones visuales o auditivas que el animal era capaz de hacer. 
Además, Pavlov se refería a las “'células corticales patológicas”' para explicar la 
conducta desviada, pero lo hizo sin fundamentar sus especulaciones con obser- 
vaciones neurológicas. Los neurofisiólogos contemporáneos aplican modernas 
técnicas electrofisiológicas y farmacológicas, entre otras, para el estudio directo 
del cerebro, pero en esta ocasión se trata de considerar las teorías que Pavlov 
enunció por primera vez hace muchos años. 


Asociación 

Pavlov planteaba que Ja conexión entre la excitación (“excitación nerviosa”) 
producida por el estímulo condicionado y el centro excitado por el estímulo incon- 
dicionado es el resultado de un tipo de atracción o drenaje de impulsos desde el 
primer centro excitado al segundo, similar a la sugerencia de William James que 
hemos mencionado. Presumiblemente, la dirección de la atracción es una cuestión 
tanto de orden temporal (el estímulo condicionado llega primero y cumple con una 
función de señalamiento) como de intensidad relativa (el centro incondicionado, por 
lo general mucho más excitado, atrae la excitación del centro £C). Lo que Pavlov 
denominaba condicionamiento es lo que los psicólogos han llamado asociación: 


Así, la conexión nerviosa temporal es el fenómeno fisiológica más universal, tanto en el 
mundo animal como en el muestro. Al mismo tiempo, es un fenómeno psicológico que los psicólo- 
gos llaman asociación, ya se trate de combinaciones derivadas de todas las formas de acciones o 


"Experimentos realizados mucho después demostraron que ciertos tipos relativamente burdos de 
reflejos condicionados podían formarse en perros sin corteza; sin embargo, deben usarse estímulos es- 
pecialmente simples que requieren de poco procesamiento, como el centelleo de wna luz brillante. Ta- 
les estudivs se reseñarán en el capítulo 14. 
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impresiones, o combinaciones derivadas de letras, palabras y pensamientos. ¿Hay alguna 
base de diferenciación para distinguir entre aquello que el fsiólogo denomina conexión 
temporal y lo que el psicólogo llama asociación? Son cosas totalmente idénticas; se fusio- 
nan y se absorben una a la otra (1955, pág. 251; fecha original, 1934). 


Irradiación, concentración e inducción recíproca 

Se supuso que dos procesos nerviosos fundamentales, la excitación y la inhibi- 
ción, Se manifiestan de diversas maneras; sus interacciones proporcionan el fun- 
damento para la operación de los hemisferios cerebrales. Los impulsos entrantes 
através de los nervios aferentes y los centros cerebrales inferiores llegan, por úl- 
timo, a algunas células especiales de la corteza apropiadas al sistema sensorial (ana- 
lizador), a las cuales pertenecen los nervios aferentes. Á partir de estas células 
especiales, el proceso excitatorio se irradia a varias otras células a lo largo de un 
área cortical, 

Esta irradiación proporciona la base para la generalización de los reflejos condi- 
cionados entre estímulos similares, a través de la superposición de las poblaciones 
de células nerviosas excitadas por los diferentes estímulos. La idea es que los es- 
tímulos que son físicamente parecidos o psicológicamente similares también acti- 
varán lugares vecinos en la corteza cerebral. Durante el entrenamiento en discri- 
minación, la irradiación se contrarresta mediante la concentración de excitación de 
regreso a las células especiales de EC+. Esta diferenciación a través de la discti- 
minación, en la cual el estímulo positivo se refuerza y el negativo no, desarrolla un 
proceso inhibitorio asociado con el estímulo negativo que reduce la propagación de 
excitación desde el estimulo positivo, y la concentra donde corresponde. La inhibi- 
ción al estímulo negativo también se generaliza a estímulos similares, lo cual pue- 
de probarse al demostrar que inmediatamente después de la presentación del estí- 
mulo negativo, la respuesta al positivo también se debilita. 

Esto es así en las primeras etapas del establecimiento de una diferenciación; 
más adelante, cuando la excitación y la inhibición se han concentrado, se produce 
la inducción recíproca. En épocas modernas este fenómeno volvió a descubrirse y 
sele bautizó como contraste conductual (véase Hilgard y Bower, 1966, págs. 514 
a 518). En la inducción recíproca, el efecto del estímulo condicionado positivo se 
hace más intenso cuando se aplica inmediatamente o poco después del estímulo 
inhibitorio concentrado; asimismo, el efecto del estímulo de inhibición es más pro- 
nunciado cuando sigue al positivo concentrado, Así, los patrones corticales even- 
tuales se determinan mediante la interacción de la excitación y la inhibición a tra- 
vés de la irradiación, la concentración y la inducción recíprocas. 

Como hemos visto, la evidencia que Pavlov usaba en favor de sus teorías corti- 
cales era por completo conductual; nunca midió directamente los campos eléctri- 
cos corticales (a técnica de esa época no permitía hacerlo), de manera que su teo- 
ría cerebral era sólo conceptual y se basaba en inferencias a partir de la conducta. 
Por lo tanto, cuando la conducta de sus perros mostraba irregularidades o grandes 
complejidades, Pavlov tan sólo complicaba las supuestas operaciones de irradia- 
ción y concentración de excitación e inhibición; por ejemplo, estipuló que éstas 
crecían y disminuían en andas y patrones temporales a raíz de una sesión de 
contticionamiento. En conjunto, las complejidades de la conducta que Pavlov des- 
cribía Pavlov no se han refutado ni aceptado con seguridad (véase, por ejemplo, 
Loucks, 1933), y muchos psicólogos consideran a su teoría cerebral como extra- 
vagante y carente de poder conceptual para hacer predicciones novedosas. 


78 


Tipos de sistemas nerviosos 

Pavlov postuló la existencia de cuatro tipos de sistemas nerviosos basados en la 
presunta fuerza de los procesos de excitación e inhibición, en la rapidez con que 
éstos cambien, y en si están equilibrados o no. Estos hipotéticos tipos resultaron 
ser muy parecidos a la antigua clasificación de los temperamentos que se originó 
con Hipócrates. Cuando la excitación y la inhibición son poderosas pero equili- 
bradas, surgen dos tipos. Si los estados son inestables, aparece el temperamento 
sengufneo; si son inertes, entonces hay un temperamento flemático. Sin embargo, 
si la excitación pesa más que la inhibición de modo que los procesos están des- 
equilibrados, el temperamento es colérico. Por último, cuando la excitación y la 
inhibición son débiles, ya sea que los estados resulten inestables o inertes, se pro- 
duce un temperamento melancólico. 

Aunque cada animal tiene uno u Otro de estos temperamentos, su carácter real 
depende de sus experiencias con el medio ambiente, Así, el carácter es “una 
amalgama de las características del tipo y los cambios producidos par el ambiente 
externo” (Pavlov, 1955, p3g. 260; fecha original, 1934). 


Segundo sistema de señales 

Aunque en sus obras Pavlov no lo destacó demasiado, reconoció que la habilidad 
en el uso del lenguaje incrementa notablemente las potencialidades humanas, y 
psicólogos soviéticos posteriores han desarrollado en gran medida esta perspec- 
tiva. Los mecanismos del reflejo condicionado que los seres humanos comparten 
con los animales inferiores se agrupan bajo el primer sistema de señales; el lenguaje 
humano proporciona el segundo sistema de señales. 


Cuando el mundo en desarrollo alcanzó la etapa del hombre, se hizo una adición de suma 
importancia a los mecanismos de la actividad nerviosa. 

... El lenguaje constituye un segundo sistema de señales de la realidad que es carac- 
terístico de nosotros, al ser la señal de las primeras señales, Por nn lado, numerosas esti- 
mutaciones del lenguaje mos han alejado de la realidad, y debemos recordar esta 
circunstancia para no distorsionar nuestra actitud hacia ella. Por otra parte, es preci- 
samente el lenguaje el que nos ha hecho humanos, un tema que no necesito profundizar 
aquí. Sin embargo, es indudable que las leyes furdamentales que rigen la actividad del pri- 
mer sistema de señales también gobiernan la del segundo, ya que éste también es 
actividad de los mismos tejidos nerviosos (Pavlov, 1955, pág. 262; fecha original, 1934). 


En otras palabras, si una luz roja centelleante es una primera señal para una RC, 
las palabras '“Juz roja ccntellcante”” constituyen una segunda señal que se refiere 
a la primera, y que puede entrar también en asociaciones condicionadas. Aunque 
Pavlov reconoció algún papel al lenguaje, no desarrolló estas ideas de modo expe- 
yimental o teórico. 


Estados patológicos 

Pavlov se interesaba mucho en la investigación de las conductas patológicas. 
Sus descubrimientos iniciales de las neurosis experimentales en los perros se 
realizaron casi accidentalmente. A un perro se le enseñaba a salivar con la presen- 
tación de un círculo, pero no recibía reforzamiento con la presentación de una elip- 
se. Entonces, después de una serie de ensayos, el radio de la elipse se acortaba, 
lo cual hacía que cada vez resultara más difícil discriminarla del círculo con el que 
se la seguía contrastando. Á medida que la discriminación se tornaba más difícil, 
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el comportamiento del perro se hacía errático. Su ejecución discriminativa se vol- 
vía muy pobre, y comenzaba a mostrar signos de “desequilibrio emocional”. 
Mientras que se je había entrenado para que permaneciera quieto en el arnés del 
aparato de condicionamiento, ahora comenzaba a agitarse, a aullar y a ladrar. Fi- 
nalmente el perro se mostraba muy inquieto y se resistía a que lo llevaran al labo- 
ratorio de condicionamiento: había adquirido lo que Pavlov denominaba una neurosis 
experimental. Pavlov pensó que tales estados de desequilibrio podían deberse 
a un conflicto entre las fuerzas antagónicas de excitación e inhibición, en lugares 
adyacentes dentro de la corteza cerebral. 

Aunque los trabajos posteriores no han demostrado que las discriminaciones di- 
ficiles (que implican recompensa versus no recompensa) constituyen el procedi- 
miento más confiable, las neurosis experimentales de este tipo se producen con 
facilidad en los animales de laboratorio al colocar el comportamiento de acer- 
camiento recompensado en conflictos directo con un castigo. Por ejemplo, a un 
gato muy hambriento que ha sido entrenado para oprimir una palanca a fin de 
obtener recompensa alimenticia, se le puede castigar con una fuerte descarga 
eléctrica por presionar el dispositivo, y el resultado será un comportamiento des- 
equilibrado y conflictivo (véanse Masserman, 1943; Dollard y Miller, 1950), El 
estudio de ese comportamiento neurótico, conflictivo y desequilibrado constituye 
una información incidental en la bibliografía referida a la teoría del aprendizaje. 

No es éste el lugar propicio para profundizar en las opiniones de Pavloy acerca 
de la patología psiquiátrica. Él creía que las neurosis experimentales en sus anima- 
les eran similares a la neurastenia en el ser humano; que los delirios de perse- 
cución correspondían a algo parecido a los estados hipnóticos en el perro; que la 
esquizofrenia catatónica era un estado pseudohipnótico de inhibición; que las reac- 
ciones maniacodepresivas representaban un trastorno de relaciones entre los 
procesos de excitación e inhibición. Pensaba que las neurosis obsesivas y la para- 
noia se deben a una inercia patológica de los procesos excitatorios de diferentes 
células motoras. 

El salto que dio Pavlov desde la fisiología cerebral especulativa a enunciaciones 
confiables acerca de la neurosis y las psicosis al parecer es demasiado pequeño 
para que se le tome como una explicación científica seria. En suma, Pavlov expli- 
caba un gran número de relaciones con base en una colisión de excitación e inhibi- 
ción en los hemisierios cerebrales, su irradiación y concentración, junto con algu- 
nas características de las células corticales, incluyendo su inercia o excitabilidad 
patológica ocasionales. 


DESARROLLOS TEÓRICOS POSTERIORES A 
PAVLOV 


Pavlov fue una figura central en el desarrollo del conductismo estadounidense; 
conductistas como John Watson (1916) se inspiraron en su trabajo y utilizaron el 
reflejo condicionado como la primera piedra para erigir su reconstrucción teórica 
de la conducta. En Rusia, Pavloy era un gigante intelectual, imponente y pode- 
roso, que durante toda su larga y fructífera vida ejerció un fuerte influjo en el 
desarrollo de la psicología y la fisiología. Muchas de las investigaciones originadas 
en el trabajo de Pavlov se ocuparon de la simple extensión del paradigma del con- 
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dicionamiento a nuevas respuestas, nuevos tipos de estímulos, nuevas especies 
de animales. Con un poco de ingenio, un psicólogo puede pensar literalmente en 
miles de pequeños problemas de investigación, el resultado de todos los cuales es 
posible que se compile en alguna enciclopedia que abarque todo lo que se conoce 
acerca del condicionamiento o el aprendizaje de una u otra especie de organismo. 


Condicionamiento interoceptivo 


Un desarrollo interesante fue la investigación del condicionamiento interoceptivo 
en los seres humanos o en animales superiores. Para este tipo de condiciona- 
miento se utiliza el procedimiento usual, a excepción de que el EC, el El (y la RD 
o ambos, implican la estimulación de un órgano interno como el riñón, el corazón o 
el páncreas. Así, una gran variedad de órganos internos pueden condicionarse 
paya responder en el sentido pavloviano a una diversidad de señales internas. 
Bykov (1957) informa de varios experimentos de esta índole. Por ejemplo, a un 
perro puede serle aplicado un tensor fisiológico (como EJ), y producir hiperten- 
sión como un reflejo incondicionado, y esta respuesta puede volverse condicio- 
nada a cualquiera de una variedad de estímulos internos o externos. De modo si- 
milar, mediante el uso de drogas o electrodos especiales implantados se provocan 
incrementos en la actividad normal y se logra el condicionamiento en órganos 
como el páncreas (iberación de insulina), el hígado (captación de glicógeno), los ri- 
ñones (extracción urinaria), la vejiga (micción), el corazón, el estómago (fMujo de 
secreciones) y la vesícula biliar, así como en varias glándulas endocrinas (como las 
suprarrenales y las salivales). Parecería que casi cualquier cosa que se mueva, 
fluya o serpentee se condiciona si una respuesta de tales elementos pudiera evo- 
carse de forma confiable y repetida mediante un estímulo incondicionado 
controlable. 

El hecho de que sea posible este condicionamiento interoceptivo sugiere inter- 
pretaciones de muchos de los llamados síntomas psicosomáticos. Por ejemplo, se 
entiende por qué un hombre se vuelve hipertenso cuando evoca a un jefe odiado, 
así como el niño que “se enferma del estómago”? cuando piensa en algún alimento 
que antes le provocó náuseas. Es concebible que el delicado balance con el cual 
nuestro sistema fisiológico mantiene en constante equilibrio a nuestro ambiente 
interno sea coordinado en parte mediante ajustes condicionales de tipo transversal 
entre las actividades de los órganos o sistemas interrelacionados; es decir, el ale- 
jamiento de un sistema de su equilibrio actúa como un EC interno para una RC an- 
ticipatoria de ajuste en un sistema compensatorio. En cualquier caso, estos es- 
tudios demuestran que los órganos internos de un animal son tan condicionables 
como los externos (aunque con una lentitud mayor, ya que tienen sus “*ritmos na- 
turales”'), Esta generalización también incluye las actividades especiales de las 
mismas células cerebrales. 


Condicionamiento inhibitorio 


y Pavlov sostenía que durante la extinción experimental se construía un proceso 
inhibitorio activo que se asociaba con el EC no reforzado, a fin de vencer e impedir 
la respuesta positiva del primero al EC. Pensaba que esta inhibición se volvía con- 
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dicionada al EC durante la extinción (o al EC— en el transcurso del entrenamiento 
de diferenciación), como si fuera un factor de antirrespuesta. Los psicólogos 
estadounidenses —especialmente Skinner (1938)— estudiaron tales datos y pu- 
sieron en duda si en verdad se requiere de un concepto como inhibición activa: 
¿por qué la totalidad de los datos de Pavlov no podrían explicarse por la simple p»é»- 
dida de excitación? Al no obtener ninguna respuesta convincente, la mayoría de los 
psicólogos dejan en suspenso sus juicios acerca de la utilidad de los constructos de 
la inhibición conductual, - 

En experimentos subsecuentes se descubrieron múltiples evidencias de la exis- 
tencia de factores inhibitorios condicionados en el condicionamiento clásico y ope- 
rante. Algunos experimentos dirigidos por Rescoria (19692) demostraron con cla- 
ridad la inhibición condicionada del miedo o la ansiedad en perros y ratas. Compo- 
nente necesario de tales demostraciones era una respuesta ya condicionada para 
un estímulo base, al cual se agregaba uno excitatorio o uno inhibitorio con el fin de 
evaluar el cambio en la respuesta. En una demostración de Rescorla (1966) se en- 
trenó a los perros primero para que evitaran la descarga eléctrica en una caja de 
dos compartimientos, al saltar de un lado a otro sobre una valla situada en medio, 
La descarga volvía a programarse para que se iniciara 30 segundos después de 
cada salto, y se aplicaba en el lugar donde el perro estaba sentado. Esta contin- 
gencia era suficiente para mantener al animal corriendo de un lado a otro para elu- 
dir la descarga. El número de saltos por unidad de tiempo era la medida del condi- 
cionamiento, y después de mucho entrenamiento los perros establecieron una 
tasa bastante estable de respuesta. Ésta era la respuesta de línea base para la s+ 
tuación de caja que se usaba entonces para comprobar los estímulos posteriores 
de excitación o inhibición. 

Después del entrenamiento de evitación, los animales recibieron una fase de 
condicionamiento pavloviano que incluía un tono y una descarga eléctrica. A cada 
perro se le encerraba en un lado de la caja y durante varias sesiones se le daban 
tonos y descargas. Para un grupo, denominado P por la contingencia positiva, al 
tono de 5 segundos siempre seguía una descarga. Para un segundo grupo, desig- 
nado con JN por la contingencia negativa, las descargas ocurrían con frecuencia y 
no había ningún estímulo que las anunciara, pero un tono de 5 segundos nunca es- 
tuvo pareado con una descarga ni-ocurrió 30 segundos antes que ésta, de modo que 
para los animales el tono servía como una señal de seguridad. Para un tercer gru- 
po, llamado A por aleatorio, los tonos y las descargas se presentaron independien- 
temente unos de otros en momentos escogidos al azar, con estos sujetos el tono 
no tenía validez predictiva para la aparición de la descarga. 

Luego de estas sesiones de tono y descarga, los perros volvieron a la caja y con- 
tinvaron con su entrenamiento de evitación. Después de que habían retornado las 
tasas estables de evitación, se efectuó una serie de pruebas de sondeo de estímu- 
lo: el tono se escucharía durante 5 segundos (sin relación sistemática con el pro- 
grama de descarga eléctrica en marcha), y se registrarían las respuestas de saltar 
de un lado a otro en periodos de 5 segundos durante medio minuto antes y durante 
un minuto después de verificar el tono-prueba. Los resultados promedio de varias 
pruebas se consignan en la figura 3.6, en la cual se muestra la tasa media de cruzar 
ha barrera en periodos de 5 segundos para seis periodos pre-EC (tono), para un 
periodo de tono (marcado EC), y para once periodos de 5 segundos después del 
de tono. 
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Promedlo de respuestas por periodo de 5 segundos 


Pre EC Post 
Periodos sucesivos de 5 segundos 


Figura 3.6. Promedio de respuestas por periodo de 5 segundos, en periodos sucesivos 
antes del comienzo del EC, durante el EC y los 30 segundos subsecuentes de trata- 
miento de condicionamiento diferencial, y después de la terminación de ese periodo 
(tomada de Rescorla, 1960). 


El grupo P (que tenía el condicionamiento *““excitatorio'” del miedo al tono) 
prácticamente duplicó su tasa de respuestas durante el tono, mientras que el 
grupo N (con el condicionamiento “inhibitorio”” del temor) redujo su tasa de res- 
puesta a alrededor de un tercio de la línea base. El grupo A, que no tenía una co- 
rrelación específica entre el tono y la descarga, no mostró cambio alguno en la tasa 
de respuesta al tono. Después del tono-prueba, las tasas de respuesta retornaban 
gradualmente al nivel de lnea base de evitación mantenido por el programa de 
descarga. 

Así, para el grupo P el tono se había convertido en un predictor confiable de la 
ocurrencia de la descarga, condicionado a una reacción de miedo; el tono-prueba 
que provocaba esta anticipación de la descarga bastaba para activar la respuesta de 
evitación. Para el grupo N, el tono se había convertido en un confiable predictor 
de la ausencia de descarga; se había transformado en una señal de seguridad, con» 
dicionada a la inhibición del miedo o al alivio de la ansiedad. Por lo tanto, el tono- 
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prueba reducía el nivel de miedo en el perro, y disminuía así su tasa de evitación 
basada en él. 

Hay demostraciones más recientes de la inhibición condicionada, con el uso de 
respuestas clásicas e instrumentales; así, ya no es posible poner en duda la reali- 
dad de tales factores opuestos o de antirrespuesta que surgen de las correlaciones 
negativas entre la presencia de un estímulo neutral (EC) y la aparición de un 
estímulo reforzante. 


Efectos inhibitorios inherentes al condicionamiento 

Aún más notable es que experimentos posteriores hayan confirmado algunas de 
las primeras observaciones de Pavlov de que el estímulo condicionado positivo 
(correlacionado con la ocurrencia del reforzamiento), termina por adquirir ciertas 
características imhibitorias propias; es decir, a medida que continúa el experi- 
mento de condicionamiento, el animal inicia procesos para el EC que se oponen a 
la RC y ala RI. En una revisión de tales efectos inhibitorios paradójicos en el con- 
dicionamiento, Kimmel observa: 


Los estudios revisados .. . apoyan la concepción de que la adquisición del condicionamiento 
clásico implica un distintivo componente negativo conjuntamente con sus características 
positivas más conocidas. Después de la formación de una asociación inicial de naturaleza 
excitatoria, el EC paulatinamente comienza a desarrollar propiedades inhúbitorias que dan 
lugar a la atenuación y a la demora de la RC, e incluso a su pérdida total bajo el reforza- 
miento continuo, así como a la disminución de la R1 en presencia del EC. Esta disminución 
de la R] se revela particularmente mediante la técnica de omitir el EC y comparar la RI 
resultante con las R7 observadas (tanto antes como después) cuando el EC está presente 
(1966, pág. 238). 


La investigación reseñada por Kimmel se refiere fundamentalmente a sujetos 
humanos y a estímulos incondicionados nocivos, como la descarga eléctrica o un 
soplido en el ojo. En estos casos, la persona puede endurecerse o prepararse para 
recibir el E7 nocivo cuando el £C aparece, con la consecuente reducción en la 
magnitud de la RI; el El ocasional dado sin previo aviso por el EC toma a la 
persona por sorpresa, y provoca la RF completa tal como al comienzo del entrena- 
miento. Desde esta perspectiva, el estímulo condicionado evocaría respuestas 
preparatorias que reducen la efectividad del EJ, y éstas a menudo estarán en opo- 
sición a la AC excitatoria. En realidad, parece (Siegel, 1978; Schull, 1979) que hay 
un conjunto de estímulos incondicionados (como las inyecciones de morfina) para 
los cuales la reacción incondicionada sigue una dirección (sensibilidad reducida al 
dolor), pero la reacción condicionada va en la dirección opuesta (sensibilidad 
incrementada). Schull (1979) propuso que los estímulos emocionales poderosos 
que desequilibran al ambiente interno activan reacciones compensatorias para 
contrarrestar ese desequilibrio; postuló, además, que estos procesos compensa- 
torios pueden ser condicionados. De esta manera, la propuesta de Schuil equivale 
a un mecanismo explicatorio de la adaptación, la disminución de la respuesta de un 
organismo a un estímulo poderoso que se repite en muchas ocasiones. 

Incluso con la situación favorita de Pavlov, de condicionamiento salival, hay evi- 
dencias de inhibición en la gradual prolongación de la latencia de la RC (su tiempo 
de ocurrencia entre el EC y el El, donde la RC a veces desaparece por completo, 
“retrocediendo”* a ese punto temporal de intervalo cuando se suministra el El. 
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Pavlov (1927) mencionaba tales fenómenos, a los cuales denominó inhibición de la 
demora. Sheffield (1965) y Elbson (1964) han reproducido estos efectos en el con- 
dicionamiento saliva] con perros. Un análisis átil de la situación propuesto por Ski- 
nner (19374) es que la inhibición de la demora se produce debido a que el sujeto 
experimental adquiere una discriminación temporal más precisa acerca del mo- 
mento de entrega del ET (alimento), a raíz del inició del EC. El intervalo entre el 
comienzo del EC y el del EJ puede concebirse como un continuo de estímulo, don- 
de los primeros indicios del intervalo están asociados con el no reforzamiento, 
mientras que los últimos, al momento de la entrega del Ef, se condicionan debido 
a su reforzamiento. Esta diferencia en el reforzamiento para los primeros y últi 
mos indicios del intervalo EC-El puede considerarse en el sentido de que esta- 
blece dos tendencias opuestas. En kh figura 3.7 puede observarse un diagrama de 
las mismas. Los primeros indicios del intervalo (justo después del inicio del EC) 
se convertirían en inhibidores condicionados, mientras que los últimos se transtor- 
man en excitadores. La tendencia a dar la RC en cualquier momento dentro del in- 
tervalo EC-El obedecería al exceso de las tendencias excitadoras en detrimento 
de las inhibidoras, trazadas por encima de ese tiempo en la figura 3.7. En esta teo- 
ría, la magnitud de la RC se vería en su punto más alto en el caso de que el Ef 
acostumbrado se demorara u omitiera en ensayos específicos de prueba. Cuando 
se procede de esta manera, aparece una larga RC casi precisamente en el mo- 
mento en que el Ef debería presentarse (véase Ellison, 1964). 


Condicionamiento de segundo orden 


El pareamiento de un estímulo neutral con uno incondicionado no sólo da lu- 
gar a que se convierta en un estímulo condicionado para la respuesta, sino también a 
que se convierta en un estímulo reforzante por derecho propio. Así, lo que antes 
era un estímulo condicionado llamado £1), puede usarse en una segunda fase de 
pareamiento para condicionar a otro estímulo neutral (E2) al mismo reflejo. En 
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Condiclonamiento Condiclonamlento 
de primer orden de segundo orden 
() £t(luz) ;——— El comida) (3) E2 (tono) ——+» El (luz) 
a Allsalivación) To AC (salivación) 
2) Er lu) ElHcomida) (4) E2(tono) El (luz) 
— + AC (sativación) 7 —= AC (salivación) 


Figura 3.B. llustración del condicionamiento de primer orden (luz a comida) y del 
condicionamiento posterior de segundo orden [tono a luz). 


1927 Pavlov informó por vez primera de este fenómeno, al que denominó cordi- 
cionamiento de segundo orden (o de orden superior), ya que se usaba un estímulo 
condicionado de primer orden (E1) para reforzar la respuesta en pareamientos 
con un estímulo de segundo orden (E2). Una demostración típica es enseñade a 
un perro a salivar en presencia de una luz, al parearla (£1) con polvo de carne 
(El); entonces, en una segunda fase se escucha un tono (E2) antes de la luz (El), 
pero la combinación no va seguida de polvo de carne. Las relaciones temporales y 
las cuatro etapas del condicionamiento pueden observarse en la figura 3.8. 

El condicionamiento de orden superior tiene una gran importancia teórica, ya 
que sugiere un medio de transferir poder de reforzamiento, así como una respues- 
ta, de uno a otro estímulo arbitrario, sin ningún reforzamiento primario después 
de la etapa inicial. Esto podría explicar, por ejemplo, de qué forma las recom- 
pensas simbólicas —como el dinero o el elogio verbal-— adquieren su valor refor- 
zante. 

Aunque el condicionamiento de segundo orden era un concepto teóricamente 
útil, no se le sometió y una investigación intensiva hasta fechas recientes, con los 
estudios de Rescorla y sus colegas (Holland y Rescorla, 1975; Rescorla, 1973; 
1978; Rizley y Rescorla, 1972), y Rashotte y colaboradores (1977). En algunos 
experimentos se estudia el condicionamiento de segundo orden usando el miedo 
basado en la descarga eléctrica; en otros se utiliza la expectativa de alimento indi- 
cada por la respuesta preparatoria del animal. Aparentemente, casi los mismos 
principios del aprendizaje son aplicables al condicionamiento de primero y de se- 
gundo orden. 

Una pregunta interesante se refiere a lo que el animal aprende en el condi- 
cionamiento de segundo orden. Rescorla (1973) señala tres posibilidades: 1, el es- 
tímulo de segundo orden (£2) hace que el animal espere al estímulo de primer or- 
den (E1); 2. El E2 hace que el animal piense en el estímulo incondicionado (E/); o 
3. el E2 llega a ser asociado directamente con la respuesta provocada por el Ef y 
por el El de primer orden. Rescorla observó que la evidencia acerca de la primera 
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opción se obtenía al modificar las propiedades condicionales del El después de que 
se había logrado el condicionamiento de segundo orden de £2 a El. En los expe- 
rimentos dirigidos por Rizley y Rescona (1972), después de que el E2 se había 
asociado con el miedo en él condicionamiento de segundo orden, el estímulo de 
primer orden El se extinguía mediante su presentación repetida sin descarga. La 
pregunta es: ¿cómo afectaría la extinción de El a la fuerza del condicionamiento a 
E2 que ha sido lograda mediante el pareamiento con el E1? Rizley y Rescoria no 
encontraron ninguna pérdida en el reflejo condicionado de segundo orden (al E2) 
que se debiera a la extinción del reflejo condicionado de primer orden (al EL), lo 
cual los llevó a concluir que los estímulos de segundo orden no operan al hacer que 
el animal espere el estímulo de primer orden y ejecute así con antelación la res- 
puesta de primer orden, Este resultado también se obtuvo con ratas en un expe- 
rimento de condicionamiento de segundo orden del apetito (Holland y Rescorla, 
1975). Sin embargo, no se produjo con palomas sometidas al condicionamiento de 
segundo orden de la expectativa de alimento ante los estímulos visuales a los cua- 
les respondían (Rashotte e! al,, 1977; Rescorla, 1978). En estos últimos expe- 
rimentos, la extinción del estímulo de primer orden a raíz del condicionamiento de 
segundo orden originó una reducción sustancial en las respuestas condicionadas al 
estímulo de segundo orden, Las investigaciones actuales se dedican a clasificar las 
diferencias de procedimiento o de especie como las responsables de las dife- 
rencias en los resultados. 

Al observar que el procedimiento de condicionamiento de segundo orden es 
muy similar al procedimiento mediante el cual el E2 se convierta en inhibidor 
condicionado se presenta una curiosa paradoja. Es decir, el El ha sido pareado 
con el Ef mientras que el E2-entonces-El no fue reforzado con el El. ¿Cómo 
puede ser que el mismo procedimiento convierta a un estímulo neutral en un EC+ 
para una respuesta, y en un inhibidor condicionado para la misma? 

Pero la paradoja es sólo aparente. La explicación es que el condicionamiento ex- 
citatorio positivo (que da lugar al condicionamiento de segundo orden) procede 
con rapidez durante los primeros ensayos iniciales de parear el E2 con el El, 
mientras que los efectos inhibitorios negativos se establecen con mayor lentitud 
(véase figura 3.9). Además, el desarrollo de la inhibición condicional al E2 depen- 
de de que el sujeto reciba muchos ensayos en los cuales se contraste cl *“El-re 
forzamiento”” con el ““E2-El-no reforzamiento”. Rizley y Rescorla (1972) y Holland 
y Rescorla (1975) efectuaron experimentos de este tipo y demostraron con clari- 
dad ambas fases. Como se advierte en la figura 3.9, hay una fase breve de adqui- 
sición de condicionamiento de segundo orden del £2, y después una pérdida gra- 
dual de Ja RC al E2 en el transcurso de los ensayos, a medida que los ensayos no 
reforzados de segundo orden se contrastan con los ensayos reforzados sólo de 
El. Ala larga, el E2 actúa como un inhibidor activo, Esto es evidente por el hecho 
de que la respuesta condicionada era más grande para el El solo que para los en- 
sayos de prueba en que el El y el E2 se presentaban juntos. 

El desarrollo reciente de poderosos procedimientos para la creación del condi- 
cionamiento de segundo orden proporciona a los psicólogos herramientas valiosas 
para el análisis de las condiciones del aprendizaje por asociación. Por ejemplo, 
Rescorla (1978) ha demostrado que el alcance del condicionamiento de segundo 
orden depende de la similitud del E2, con el El, y de la consistencia con la cual E2 
va seguida de El versus El * (donde ambos son estímulos diferentes condicionados 
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al mismo ED), Rescorla también ha investigado las discriminaciones de segundo 
orden en un procedimiento donde un estímulo de segundo orden se pareaba con- 
sistentemente con un EC excitatorio positivo, y Otro estímulo de segundo orden 
se pareaban con un EC inhibitorio negativo. Éstos y otros arreglos experi- 
mentales relacionados habrán de proporcionar nuevos descubrimientos que enri- 
quecerán nuestras teorías acerca de la formación de la asociación. 


Condicionamiento clásico e instrumental 


Aunque algunos autores —en especial los fisiólogos— afirman que el aprendizaje 
y el condicionamiento estudiado por Pavlov son esencialmente sinónimos, la mayo- 
ría de los psicólogos no comparte esta opinión. De este modo, se ha establecido 
una distinción entre el condicionamiento del tipo pavloviano denominado condicio- 
namiento clásico, y otra variedad que se conoce como condicionamiento instrue- 
mental o condicionamiento operante, 

La distinción consiste en que en el condicionamiento instrumental el refor- 
zamiento en un ensayo se hace contingente (dependiente) de la ocurrencia de una 
respuesta crítica, mientras en el clásico el reforzamiento (EJ) se suministra inde- 
pendientemente de si el sujeto responde o no a la señal, Dos psicólogos polacos, 
Miller y Konorski (1928), informaron de un ejemplo inicial de condicionamiento 
instrumental, al enseñarle a un perro a levantar una pata delantera ante una señal, 
con el fin de obtener una recompensa alimenticia; y distinguieron este entrena- 
miento del método estándar de Pavlov. Hilgard y Marquis (1940) acuñaron los tér- 
minos condicionamiento clésico e instrumental que se usan hoy en día. Otros auto- 
res relacionados con el área del aprendizaje han utilizado diferentes denomi- 
naciones para ambos tipos de condicionamiento; en el cuadro 3.1 pueden verse 
algunos de esos términos alternativos. 

Como hemos dicho, en los casos prototipo el condicionamiento clásico y el ins- 
trumental difieren claramente en los procedimientos o en la programación de los 
eventos de estímulo. En el clásico, el EJ o estímulo reforzante es contingente a la 
presentación del EC y se aplica independientemente de cualquier respuesta que el 
sujeto pueda dar (aunque tal vez el mismo sujeto no lo piense de este modo). Asi- 
mismo, la respuesta condicionada que se mide suele ser una parte fraccional de —o 
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CUADRO 3.1. Clasificaciones dobles del aprendizaje propuestas por diferentes 
autores (tomado de Kimble, 1961, pág. 66). 


Término para el Término para el 
Autor(es) condicionamiento clásico condicionamiento instrumental 
Thorndike(1911)] Ajuste asociativo Aprendizaje de 


ensayo y error 
Miller y Konorski 
(1928), (1937a) 


(19373) Tipo 1 Tipo Il 
Skinner (1937a) Tipo E, o respondiente Tipo R, u operante 
Schlosberg (1937) Condicionamiento Aprendizaje exitoso 
Hilgard y Marquis Condicionamiento Condicionamiento 
(1940) clásico instrumental 
Mowrer(1947) Condicionamiento Solución de problemas 


se asemeja a— la respuesta incondicional provocada por el Ef. En el condicio- 
namiento instrumental, la presentación del reforzador es por lo general con- 
tingente a una respuesta especificada; por ejemplo, una rata hambrienta presiona 
una palanca para obtener alimento. En esta correlación puede entrar un estímulo 
discriminativo; por ejemplo, se puede dar comida por presionar una palanca sólo 
cuando se oye un tono en la cámara de condicionamiento, y no cuando el tono no 
se escucha. (Skinner le llama operante discriminada.) La respuesta operante (pre- 
sionar la palanca) por lo común no se asemeja a la respuesta que se da ante el estí. 
mulo reforzante (comer y salivación). 

Los procedimientos difieren un tanto en sus variaciones manipulables obvias: 
por ejemplo, el intervalo EC-El es una variable inherente al condicionamiento 
clásico, mientras que el intervalo respuesta-reforzamiento (la llamada demora del 
reforzamiento) es propia del paradigma del condicionamiento instrumental, Es un 
hecho notable que las leyes dinámicas del aprendizaje (adquisición, extinción, ge- 
neralización, etc.) son muy similares en los dos tipos de situaciones de apren- 
dizaje; en muchos casos el término recompensa sólo necesita sustituirse por el tér- 
mino estímulo incondictonado. Teóricos como Hull y Guthrie negaban que hubiese 
alguna diferencia real en la naturaleza del aprendizaje en los procedimientos clá- 
sico e instrumental, Otros teóricos (principalmente Mowrer, 1947; Schlosberg, 
1937; y Skinner, 19374) creían que en las dos formas de condicionamiento ge- 
neralmente intervenían sistemas de respuesta un tanto distintos. Así, las conduc- 
tas se dividieron en aquellas mediadas por músculos esqueléticos estriados (como 
los movimientos de las extremidades) versus las mediadas por músculos lisos 
(como el corazón y las glándulas) a partir del sistema nervioso autónomo. Se creía 
que las respuestas de este segundo tipo eran involuntarias, causadas por estírmlos 
incondicionados (por ejemplo, la descarga eléctrica provoca excitación en todo el 
sistema nervioso autónomo), y sólo eran condicionables de la manera clásica. Por 
atro lado, las respuestas esqueléticas raras veces están bajo el control de estí- 
mulos incondicionados, se “emiten voluntariamente'' en lugar de ser provocadas 
por un £[ y se condicionan principalmente por los procedimientos de condiciona- 
miento instrumental. Ésta era la teoría estándar de ““dos factores”” que dominó en 
los Estados Unidos durante aproximadamente treinta años a partir de 1937. Alo 
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largo del libro hablaremos más de ella, de las investigaciones que han surgido a su 
alrededor, y de cómo se le ha modificado a la luz de nuevas concepciones. Baste 
decir que en contra de esa distinción se han planteado algunos argumentos convin- 
centes, y que la diferenciación teórica ha dado lugar a interesantes debates (Te- 
rrace, 1973). Pero nos estamos alejando de nuestro tema. 


Comparaciones filogenéticas 


El reflejo condicionado proporcionó una metodología útil para el estudio com- 
parativo de las formas de aprendizaje en muchas especies diferentes de orga- 
nismos, En principio puede ser una poderosa herramienta en manos de un psicólogo 
comparativo. Una vez que un estímulo incondicionado confiable se ha encontra- 
do y aislado, la técnica puede usarse para investigar si un organismo determinado 
tiene sensibilidad a una dimensión dada de variación de estímulo (por ejemplo, 
para descubrir si las ratas no ven los colores), o si el animal puede aprender discri- 
minaciones condicionales de cierta complejidad. Algunos tipos de comparaciones 
entre especies se prestan a una mala interpretación, ya que la conducta aprendida 
es una función de muchas variables (temperatura, nivel de impulso, naturalidad del 
ambiente de prueba, estímulos distractores, preferencias en lo que toca a recom- 
pensas), de modo que los valores óptimos varían considerablemente entre las es- 
pecies. Por lo tanto, los psicólogos comparativos tienden a no interesarse de- 
masiado en la ““inteligencia”” relativa de diferentes animales para el aprendizaje de 
laberintos de distintas complejidades. Más bien prefieren estudiar la manera en 
que el comportamiento de una sola especie es afectado por la variación en diver- 
sos parámetros de aprendizaje; también se interesan en saber si los organismos 
en un nivel particular de desarrollo flogenético son capaces de mostrar uno u otro 
tipo de aprendizaje, o el fenómeno de aprendizaje en las circunstancias más óptimas 
que puedan crearse para ese animal. 

Ciertamente, desde la época de Darwin la psicología comparativa ha trabajado 
con la creencia de que existen varios “niveles” de habilidades de aprendizaje y di- 
ferentes tipos o clases de aprendizaje, ordenados desde las formas simples (como 
la habituación), hasta las complejas (como el aprendizaje de la resolución de pro- 
blemas verbales). También se ha creído que estos niveles o tipos de aprendizaje se 
suman progresivamente a medida que se asciende en la escala evolutiva, desde los 
simples organismos unicelulares, pasando por algunos animales filamentados infe- 
riores, hasta llegan a los primates y al ser humano. Los psicólogos comparativos, 
en especial los rusos, así como los etólogos, se han dedicado durante muchos 
años a reunir y clasificar pacientemente tales resultados. 

Razran (1971) reseñó esa gran diversidad de datos y con base en ellos elaboró una 
perspectiva teórica. Organizó su presentación en torno a una jerarquía evolutiva 
de tipos de aprendizaje, que se resumen en el cuadro 3.2. Para indicar a grandes 
rasgos algunos de los tipos de aprendizaje que no se han examinado aquí, la sensi- 
bilización se refiere a una gran sensibilidad (umbral inferior) de una RI, debido a 
que ha sido evocada recientemente; la configuración alude a la diferenciación de 
patrones específicos de estímulos compuestos; el aprendizaje educativo es como el 
aprendizaje predictivo, que hace uso de nociones de la permanencia del objeto; 
simbosémico, semémico y logicémico son las denominaciones que corresponden a 
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CUADRO 3.2. Niveles evolutivos del aprendizaje según 
Razran (1971, págs. 310-311). 


A) Reactivo [no asociativo) 
1, Habituación 
2. Sensibilización 
B) Conectivo [condiciona miento) 
3. Inhibitorio (castigo) 
4. Clásico 
5. Reforzante (condicionamiento instrumental, operante, 
de recompensa) 
€) Integrativo fperceptivo) 
6. Aprendizaje sensorjal-sensorial 
(precondicionamiento sensorial) 
7. Contiguración 
B Aprendizaje educativo 
D) Smbólico [pensa miento) 
9. Simbosémico 
10. Semémico 
11. Logicémico 


tres etapas del aprendizaje lingúístico, desde palabras aisladas y predicaciones 
simples hasta construcciones proposicionales. 

Al ordenar especies en una escala desde el pkylm más simple a] más complejo. 
Razran intentó demostrar que el aprendizaje más complejo sólo pueden lograrlo 
los organismos en un nivel superior de la escala evolutiva. Se supone que esta co- 
rrelación se debe a que las fuerzas evolutivas seieccionaban variaciones en las es- 
pecies y desarroilaban asi organismos altamente estructurados, capaces de mos- 
trar formas superiores de aprendizaje. Algunas de las generalizaciones de Razran 
a partir de los estudios experimentales son las siguientes: 


e Loscelenterados se habitúan con facilidad, pero no son susceptibles de condicionamiento. 

= Los cordados prevertebrados y los mamíferos se habitúan, llegan a ser sensibilizados, 
pero tampoco son condicionables. 

+ El precondicionamiento sensorial y la coniiguración aprendida de estímulo sólo es posi- 
ble en los pájaros y en los mamíferos. 

e El aprendizaje educativo es factible con pájaros y mamiferos más inteligentes (cuervos, 
urracas, perros y gatos), pero no conlos menos inteligentes (palomas, gallinas, patos y 
conejos). 

+ Los conjuntos de singularidad y de aprendizaje son en gran parte comportamientos pro- 
pios de los primates, y el simbolismo es un logro exclusivamente humano. 


La evidencia general apoya claramente la tesis de Razran acerca de un desarrollo 
jerárquico de las habilidades de aprendizaje. Así, con las técnicas de condiciona- 
miento clásico no se puede entrenar a todos los organismos, aunque todos pare- 
cen susceptibles de habituación. A Razran corresponde el mérito de haber reali- 
zado la difícil labor de compilar y organizar los numerosos hechos disponibles en la 
bibliografía rusa e inglesa. El peligro de esas caracterizaciones tan amplias es que 
los resultados negativos se ponderan como diagnóstico (por ejemplo, que la espe- 
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cie X no muestra aprendizaje del tipo Y) cuando en realidad la única conclusión a 
que se puede arribar es que uno o más intentos con EC, El y procedimientos es- 
pecíficos han fallado. El siguiente tema a discutir sugiere que debemos ser cuida- 
dosos a] muestrear el rango de estímulos con “validez ecológica'* antes de esta- 
blecer conclusiones acerca de lo que una especie dada puede o no aprender. 


Equivalencia de la asociabilidad 


Recientemente los psicólogos se han interesado por variaciones inherentes a la 
especie, en el sentido de qué estímulos y qué respuestas son fácilmente condicio- 
nables (con procedimientos clásicos o instrumentales) y cuáles son difíciles o im- 
posibles de condicionar. Antes de que esto ocurriera, la posición general de las 
teóricos del aprendizaje alrededor de este terna constituía lo que Seligman (1970) 
ha denominado premisa de la equivalencia de la asociabilidad. A grandes rasgos, 
es la suposición de que cualquier estímulo que el organismo es capaz de percibir 
puede estar vinculado a cualquier respuesta que le sea posible dar, de acuerdo con 
las leyes estándar del aprendizaje, y con indiferencia relativa acerca de qué está 
vinculado con qué. Algunos párrafos de Pavlov sugieren dicha posición: 


Es obvio que la actividad refleja de cualquier órgano efector puede escogerse para pro- 
pósitos de investigación, ya que los estímulos de señalamiento pueden vincularse con 
cualquiera de los reflejos innatos (1927, pág. 17). 


Cualquier fenómeno natural elegido a voluntad puede convertirse en un estímulo condi- 
cional ... cualquier estímulo visual, cualquier sonido deseado, cualquier olor, o la esti- 
mulación de cualquier parte de la piel (1928, pág. 86). 


Este principio de la equivalencia de la asociabilidad es en esencia el responsable 
de las elecciones arbitrarias, casi improductivas y artificiales, de estímulos y res- 
puestas sin interés que los psicólogos del aprendizaje han usado rutinariamente 
durante los últimos ochenta años. Si el principio es verdadero, cualquier estímulo 
o respuesta que se encuentre a mano en el laboratorio operará de manera adecua- 
da, ya que habrán de aplicarse las mismas leyes generales, sin importar lo que se 
use. A] menos, eso se creía, 

Algunos teóricos del aprendizaje comienzan a dudar de esta creencia: han apare- 
cido ciertos datos críticos que infringen claramente la regla y lo hacen sin discusión 
posible. Desde hace bastante tiempo, se cuenta con indicios de esta naturaleza, 
que se presentaron incluso en las investigaciones originales de Thorndike (1911) 
con la caja-problema, Aunque sus gatos aprendieron con facilidad a tirar de alam- 
bres y manijas, y a presionar botones para escapar de la caja, Thorndike se en- 
frentó a dificultades poco comunes al intentar enseñarles a que se lamieran (asea- 
Yan) para escapar, a pesar de que la acción de asearse tiene una tasa muy elevada 
de espontaneidad. 

Setigman (1970) reseñó muchos otros casos. Por ejemplo, es casi imposible en- 
señar a un perro hambriento a que bostece para obtener una recompensa alimenti- 
cia, enseñar a una rata a asearse para ganar una recompensa, o reducir la conducta 
que muestra de “levantarse sobre sus patas traseras”* castigándola con un sonido 
alto. Por muchos años, parte del folklore del laboratorio ha sido el que las ratas y 
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los gatos raras veces aprenden o mantienen respuestas de evitación de presionar 
una palanca, mientras que permitirles saltar fuera del aparato para eludir una des- 
carga eléctrica se condiciona con facilidad. Estas cuestiones pueden atribuirse a 
uno uy otro contaminante de desequilibrio: un nivel de respuesta inicial demasiado 
bajo, incompatibilidad del El provocador con la respuesta a condicionar, o cual- 
quier otra cosa. Los científicos casi nunca carecen de excusas post hoc para salvar 
un principio general que resultó alabado. 

Mientras tanto, continúa aumentando la evidencia.de que la evolución ha dotado 
de modo innato a ciertas especies con una afinidad o ““estada de preparación” * 
para asociar ciertos eventos de estímulo y de respuesta, y no otros. Las 
conexiones que se aprenden con facilidad parecen tener una clara base evolutiva 
(por ejemplo, el huir para escapar de la estimulación aversiva); aquellas para las 
cuales el organismo está '“contrapreparado'' (para usar el término de Seligman) 
parecen arbitrarias y ““antinaturales”?. Son artificiales en el sentido de que toman 
una respuesta que interviene en una secuencia consumnatoria (por ejemplo, la dan- 
za de enamoramiento de las palomas en celo), e intentan vincularla dentro de un 
sistema diferente de motivación y recompensa (''bailar'* para obtener comida); 
o son artificiales en el sentido de que para que haya una ejecución condicionada efi- 
ciente es necesario eliminar y evitar una parte de la reacción innata del organismo 
al estímulo de reforzamiento (o serie de actos naturales que levan a su consumación). 

Breland y Breland (1960) proporcionaron ejemplos sorprendentes acerca de la for- 
ma en que diversos animales impedían que los patrones intrusos de comportamiento 
de una especie determinada entraran en las tretas de condicionamiento operante 
arbitrario que intentaban enseñarles. Lenneberg (1967) ha dado un paso más en lo 
que se refiere al estado de preparación de las especies al conjeturar que el infante 
humano está preparado, o preprogramado por naturaleza, para la adquisición del 
lenguaje. Todos los niños aprenden un lenguaje a pesar de la típica ausencia de 
contingencias de entrenamiento cuidadosamente arregladas. Lenneberg supone 
que el estado de preparación para el lenguaje es una característica humana pecu- 
liar. Sin embargo, varios investigadores han puesto en duda esta suposición al em- 
prender proyectos a largo plazo para enseñar a chimpancés o gorilas selecciona- 
dos a comunicarse simbólicamente con sus entrenadores humanos. Por ejemplo, 
Gardner y Gardner (1971) fueron los primeros en informar que habían entrenado a 
un chimpancé (Washoe) para que se comunicara con ellos en el lenguaje estadouni- 
dense de señales. En lugar de expresiones verbales se usó lenguaje manual de los 
sordos, ya que los chimpancés tienen un aparato vocal imperfecto. Washoe apren- 
dió a señalar un nombre para objetos visuales, para disposición de objetos en rela- 
ción (“naranja en caja””), y para avisar cuándo quería comer, beber, jugar, etcé- 
tera. Los responsables de los diversos proyectos han presentado afirmaciones 
muy inquietantes acerca de las habilidades lingúísticas del primate (Desmond, 1979). 

Los escépticos argumentan que los aspectos cruciales del lenguaje ““real'' están 
ausentes en los datos de señalamiento de los primates. Por ejemplo, pocas veces 
indican de manera espontánea, sin instigación y raramente señalan objetos 
ausentes; sólo muestran una apreciación rudimentana del significado de los sig- 
nos, escasa abstracción en el uso de éstos en diversas situaciones, y muy pocas o 
ninguna restricción sintáctica para generar hileras de signos y componer vna ““ora- 
ción”*. Terrace (19794, 1979b) ha criticado severamente los proyectos del lengua- 
je con primates debido a la inadecuada recopilación de datos y a la experimentación 
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de mala calidad. Argumenta que, de modo similar a las demostraciones de la per- 
cepción extrasensorial, las del lenguaje real en los primates deben organizarse con 
gran cuidado para reunir evidencia confiable de las afirmaciones importantes. En 
particular, deberían usarse las pruebas dable-ciego para garantizar que el ““lengua- 
je del chimpancé” no estuviese sólo en Jos ojos del espectador (que sabe lo que 
el chimpancé debe señalar en un contexto dado), y que el señalamiento que hace el 
primate no sea instigado inadvertidamente por entrenadores bienintencionados. 
Terrace señala que los métodos habituales para informar acerca de datos de seña- 
lamiento son inadecuados porque pasan altamente filtrados a través de un intér- 
prete prejuiciado (el entrenador), que conoce lo que el chimpancé ha de señalar. 
La preocupación es que el intérprete predispuesto no vea un “*balbuceo”” aleatorio 
como la comunicación de algo razonable y sintácticamente correcta. La validez 
de los argumentos de Terrace, y la manera de alterar la recopilación de datos en 
los proyectos con primates, son temas actuales motivo de discusión y controver- 
sia. Es evidente que la atención que se presta a los proyectos de entrenamiento 
del lenguaje remarca la rejevancia científica de la cuestión de si el verdadero len- 
guaje es mediado por mecanismos neurales propios del cerebro humano. 

Para regresar a nuestro tema, un libro titulado Constraints on learning (Hinde y 
Stevenson-Hinde, 1973) informa y clasifica numerosos casos de reacciones supra- 
preparadas y contrapreparadas que dependen del arreglo de condicionamiento. 
Como hemos visto, parece ser que un procedimiento de condicionamiento se in- 
troduce siempre en un flujo de continuo conductual que ocurre de modo natural en 
un estado motivacional dado, como el hambre, y que los resultados del procedi- 
miento de condicionamiento dependen de la forma en que la respuesta a condicio» 
nar se ajuste o encaje en cosas que el animal haría de modo natural cuando tuviera 
hambre. 

Un estudio de Shettleworth (1975) es ilustrativo y notario porque esta investi» 
gadora invirtió mucho tiempo en la observación y registro de los comportamientos 
naturales de sus animales (hámsters dorados) en una situación de prueba dada. Al 
registrar la frecuencia y duración de 24 clases distintas de respuestas, Shettle» 
worth logró describir cuáles se incrementan a medida que el animal se vuelve ham- 
briento, y cuáles disminuyen. Con esta información se dedicó a condicionar instru- 
mentalmente una u otra respuesta seleccionada usando comida como recompensa 
para el hámster hambriento, y escogía respuestas que tenían tasas promedio de 
ocurrencia comparables y espontáneos antes del condicionamiento. Sus resul- 
tados, que aparecen en la figura 3.10, revelan tasas de aprendizaje muy diferentes 
para seis respuestas distintas. Para identificar a grandes rasgos algunos de los 
comportamientos, **rascar”” indica que el hámster se erguía y restregaba sus pa- 
tas delanteras contra una pared de la jaula de prueba; la *“posición erecta abierta'* 
consistía en levantarse sobre las patas traseras sin tocar la pared; “cavar” y “la- 
varse la cara'” son obvias; '“rascarse”” el cuerpo se hacía con las patas traseras, y 
el ''marcaje de olor”? se refería a que el hámster presionaba su glándula olfatoria 
de uno de sus flancos contra una pared, con el lomo arqueado y el rabo levantado. 

Es importante notar que los tres comportamientos que se incrementaron inten- 
samente al ser recompensados con alimento eran los mismos que aumentaban un 
tanto cuando el animal se sentía hambriento y esperaba comer; mientras que los 
tres comportamientos (lavarse, rascarse, marcar) que se condicionaban pobre- 
mente o nada eran los que habían disminuido cuando el hámster estaba hambriento 
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Sesiones de reforzamiento de Shettleworth, 1975). 


y esperaba comida. Asimismo, las respuestas condicionadas de estas últimas for- 
mas que sí ocurrieron se hicieron *“artificialmente”” abreviadas, como si la razón 
del animal para rascarse, por ejemplo, cambiara desde “*eliminar irritación de un 
piquete de pulga”' hasta ““hacer que opere el dispensador de comida”. Shettle- 
worth concluyó que las tasas de condicionamiento de patrones diferentes de ac- 
ción varían en razón de lo compatible que sea la respuesta de criterio en relación 
con aquellas que el animal ejecutaría de modo natural cuando aguardara la recom- 
pensa. Si la respuesta a condicionar es incompatible con las esperadas en prev 
sión de la recompensa, entonces el arreglo crea conflicto, interferencia y bajos ni- 
veles de condicionamiento. 

Bolles (1970, 1972) ya había analizado aquellos casos en que los animales falla- 
ban en el aprendizaje de respuestas de evitación a estímulos dolorosos, y llegó a 
una conclusión similar a la de Shettleworth. Bolles sostenía que los animales co- 
mienzan con un repertorio de reacciones defensivas innatas a situaciones dolo- 
rosas o amenazantes, que denominaba “reacciones defensivas específicas de la 
especie” (RDEE). Para la rata atemorizada por la descarga eléctrica, tales reac- 
ciones incluyen huir, inmovilizarse, atacar con agresividad a algún objeto, saitar, 
correr en círculos y chillar. Bolles propuso que un anima! aprendería con facilidad 
una respuesta específica de escape o evitación para la descarga o el miedo si la 
respuesta es una de sus RDEE (o muy compatible con una de ellas), como huir o 
inmovilizarse, pero que no aprendería fácilmente una respuesta que no fuera una 
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RDEE. El investigador sugiere que esta perspectiva altera el tradicional análisis 
de reforzamiento del aprendizaje de evitación. El suyo no presupone una asocia- 
ción directa desde el EC hasta una respuesta de evitación, más bien, el EC hace 
que el animal sienta miedo, lo cual activa un repertorio de las RDEE: la “*correcta”” 
se elige entre las demás no tanto porque elimine el EC y reduzca el miedo, sino 
porque las otras son ineficaces en la situación experimental, y se les castiga con la 
descarga continua. 


Asociación selectiva de los estímulos 
alimenticios con la enfermedad 


García y sus colaboradores (García y Koelling, 1966) hallaron en sus experi- 
mentos un caso aparente de estado de preparación selectiva, Ratas sedientas be- 
bían agua endulzada con sacarina de una espita en la que cada lamida hacía que des- 
tellaran luces y se oyeran ruidos. Durante la sesión se expuso a las ratas a fuertes 
rayos X, lo cual provocaba que los animales se sintieran enfermos y con náuseas, 
aunque no antes de una hora. Posteriormente, les sometió a prueba en cuanto a su 
aversión aprendida (o enfermedad condicionada) a los estímulos de luz y ruido, y al 
agua endulzada con sacarina. Se descubrió que los animales habían adquirido una 
fuerte aversión al agua con sacarina, pero ninguna a la luz destellante y al ruido. El 
cerebro había escogido el sabor de la sacarina en vez de los “ruidos brillantes” 
para asociarlo selectivamente con la reacción incondicionada de sentirse enfermo. 

Podría argumentarse que para las ratas el sabor de la sacarina es tan sólo un es- 
tímulo más notorio que la combinación de luz y ruido. Para descartar esta obje- 
ción, Garcia y Koeling idearon un experimento complementario en el cual el EC 
consistía en lamer **aguna con sacarina brillante y ruidosa”*, mientras que el El era 
una dolorosa descarga eléctrica en las patas. En una prueba posterior se descubrió 
que el ruido brillante había adquirido propiedades aversivas, mientras que el agua 
con sacarina había alcanzado relativamente poca asociación con el El de descarga 
eléctrica. Por eso parecía que los El aplicados externamente (la descarga en las 
patas) se condicionaban con facilidad a indicios externos como las luces destellan- 
tes y los ruidos, mientras que las RÍ internas —como los desórdenes estomaca- 
les, náuseas y enfermedad— se asociaban selectivamente a los sabores novedo- 
sos. Domjan y Wilson (1972) y Revusky y García (1970) repitieron y ampliaron los 
resultados básicos anteriores, En otros trabajos García propuso que esta asocia- 
ción selectiva de un sabor novedoso con una enfermedad inducida puede ocurrir 
en demoras temporales muy prolongadas (hasta de muchas horas), que está mu- 
cho más allá del rango de los intervalos EC-El en los cuales puede hacerse que 
ocurra el condicionamiento en la situación típica que implique un estímulo arbitra- 
rio y fásico. Cuando un animal se enferma está selectivamente prejuiciado, por así 
decirlo, para recordar o “traer a la mente” la última sustancia novedosa que ingi- 
rió, o el lugar distintivo donde comió, y asociar ese sabor o lugar con 3u malestar 
actua). Como diría Seligman, la conexión entre el sabor y la náusea está altamente 
preparada por la estructuración innata del organismo. 

Experimentos posteriores revelan diversas complicaciones. Primero, la rove- 
de * de la situación de alimentación que sigue a la enfermedad es crítica. Los ani- 
males pueden aprender a evitar indicios externos de alimentación seguidos de 
náusea (inducida por una inyección de veneno); pero sólo si tales indicios (como un 
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comedero distinto para una rata) son relativamente novedosos y se introducen en 
una situación de prueba a la cual el animal se ha habituado por completo. Asi, des- 
pués de habituar a las ratas durante 25 sesiones diarias a comer una mezcla de sal- 
vado húmedo en un determinado recipiente ubicado dentro de una caja de prueba, 
Nitchell, Kirschbaum y Perry (1975) descubrieron que si los animales pasaban dos 
sesiones comiendo de un recipiente novedoso y entonces se les inyectaba veneno, 
evitarían comer de ese recipiente durante los días subsiguientes. Sin embargo, 
prácticamente no se producía evitación del recipiente si sólo se habían tenido diez 
sesiones de habituación antes de los ensayos de envenenamiento con él. De modo 
que la capacidad del animal para asociar la náusea diferencialmente con un indicio 
externo de alimentación aumenta cuanto más novedoso sea ese indicio en relación 
con otros a los que ya se ha habituado. 

Una segunda complicación es que la irrupción de malestar estomacal y de náu- 
sea parece hacer a los animales más tímidos en lo que toca a cualquier novedad en 
sabor o en ubicación conectados con la alimentación. Esta aversión general, llama- 
da »eofobia (evitación de cosas novedosas), tal vez ayude a explicar algunos de los 
datos de García que al parecer demuestran nuevas asociaciones entre el sabor y la 
náusea, aprendidas durante intervalos EC-El extremadamente largos. Si un ata- 
que de náusea provoca que el animal evite cualquier situación novedosa de alimen- 
tación. no es necesario invocar una asociación específica de un sabor nuevo espe- 
cífico presentado justo antes de la náusea para explicar su aversión hacia el sabor o 
los indicios de alimentación novedosos. Por ejemplo, Mitchell, Kirschbaum y Perry 
(1975) descubrieron que un solo pareamiento de la náusea con el actu de comer en 
un recipiente muy conocido bastaba para causar una evitación casi total del acto de 
comer de un recipiente poco conocido (relativamente nuevo) durante los subse- 
cuentes días de prueba. 

El descubrimiento de la neofobia en los animales a continuación de la náusea no 
debe hacer que rechacemos toda idea del condicionamiento de aversiones 
específicas a la comida. Tales aversiones son muy numerosas. Sin embargo, los re- 
sultados de neofobia si incrementan las exigencias experimentales para los investi- 
gadores que deseen demostrar aversiones específicas del gusto en experimentos 
de condicionamiento. 

Los hechos reseñados en esta sección, que muestran diferentes tasas de apren- 
dizaje de distintas conductas y asociación selectiva de indicios internos versus ex- 
temos, favorecen con claridad el abandono de la premisa de la asociabilidad equi- 
valente. Los hechos mismos no se “'explican'” en ningún sentido diciendo que el 
organismo está “*preparado”' o ““impreparado”” para hacer una asociación dada, ya 
que eso sólo proporciona otro nombre a la observación de que la tasa de condi- 
cionamiento era rápida o lenta en casos particulares. Las explicaciones más proba- 
bles pudieran ser de un tipo evolutivo y de desarrollo, que ilaminen la significación 
adaptativa de ciertas predilecciones actuales sobre aquellas clases de eventos que 
tienen probabilidades de estar asociados en el ambiente natural del animal. 


APRECIACIÓN DE LA CONTRIBUCIÓN DE PAVLOV 
A LA TEORÍA DEL APRENDIZAJE 


Pavlov ha ejercido una gran influencia en la teoría del aprendizaje, en particular 
gracias a sus investigaciones sistemáticas, sus teorías de la asociación, y sus pre- 
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dilecciones en torno a los fenómenos que merecen investigarse. Moldeó el para- 
digma del condicionamiento de asociaciones establecido por el pareamiento de 
eventos de estímulo, y ese paradigma ha constituido un fuerte influjo y un pode- 
roso atractivo para cualquier estudioso del aprendizaje. 

Razran (1965) condensa el ascendiente de Pavlov en varios puntos que pueden 
sintetizarse de la siguiente manera: 

1. Pavlov estimuló un gran número de investigaciones experimentales con el 
método del estímulo pareado, con todo tipo de organismos, durante toda la vida de 
éstos y con una gran variedad de estímulos y de respuestas. Razran estimó que 
para 1965 se habían efectuado alrededor de 6 000 experimentos usando el para- 
digma exacto del condicionamiento clásico de Pavlov; estos experimentos se di- 
fundieron al menos en 29 idiomas, pero más frecuentemente en ruso y en inglés, 

2. Pavlov transformó la noción general del aprendizaje por asociación mediante 
el condicionamiento en un área sumamente paramétrica de estudio; es decir, las 
inflvencias cuantitativas sobre el condicionamiento le interesaron desde el comien- 
zo. Un ejemplo es la persistencia de sus términos para definir las variables signi- 
ficativas, En el glosario de términos de Kimble (1961), relativo al condicionamien- 
to y alaprendizaje, 31 se atribuyen a Pavlov y 29 a todos los demás psicólogos. 

3. El científico ruso logró que el reflejo condicionado se adoptara caro la unidad 
básica más conveniente para la totalidad del aprendizaje. Áunque tal conveniencia 
es motivo de algunas polémicas y otras unidades compiten con ella (mientras que 
algunas autoridades cuestionan la existencia de esa unidad básica), no hay dwda de 
que ocupó un prominente lugar durante muchos años. 

4. Al introducir la noción del segundo sistema de señales, privativo del ser hu- 
mano, Pavloy evitó que el sistema se congelara en un nivel reduccionista impro- 
dactivo, en el cual no se haría distinción alguna entre el aprendizaje animal y el hu- 
mano. Por extraño que parezca, acusó a los psicólogos estadounidenses de exage- 
rada simplificación y de no estar en armonía con la complejidad de los hechos reales, 

5. El constante interés de Pavlov por la psicopatología, iniciado en 1903 pero 
que se puso de manifiesto particularmente en los últimos años de su vida, abrió la 
posibilidad de fructíferas reconciliaciones entre la teoría del aprendizaje y la psi- 
quiatría. Razran observa que de los seis volúmenes en ruso en los que se reseñan 
los seminarios de los miércoles de Pavlov, tres de ellos, que abarcan 1 716 pági- 
nas, son informes de demostraciones clínicas en las cuales participó. 

6. Incluso apareció y se estudió el paradigma del condicionamiento instrumental, 
se descubrió que la mayor parte de los parámetros encontrados en el paradigma 
del condicionamiento clásico aún permanecían vigentes. A pesar de algunas dife- 
rencias, los hechos fundamentales del reforzamiento, la extinción, la generaliza- 
ción, etc., son válidos. Skinner, quien difícilmente puede considerarse un pavlo- 
viano, emplea muchos de los términos del científico ruso para describir las relaciones 
funcionales dentro de su variedad de condicionamiento operánte. Aunque fue 
mucho más allá en el estudio de los programas de reforzamiento, los primeros ex- 
perimentos acerca del reforzamiento intermitente se realizaron en la línea esta- 
blecida por Pavloy, Como el aprendizaje recompensado —que se ajustaban mejor 
al paradigma instrumental que al clásico— era característica de los estudios esta- 
dowmidenses del aprendizaje animal, el trabajo de Pavlov se hizo más aceptable 
cuando se descubrió que la mayor parte de los principios también resultaban váli- 
dos dentro del condicionamiento instrumental. 
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Al intentar hacer estudios puramente objetivos, Pavlov se anticipó al conductis- 
mo estadounidense y después contribuyó a su tradición. Aunque permaneció estric- 
tamente dentro de los marcos de la fisiología, como él la entendía, era consciente 
de que trataba con problemas esencialmente psicológicos, y en sus seminarios de 
los miércoles hizo muchas referencias a las obras de los psicólogos que había leí. 
do. Tenía en gran estima a E. L. Thomdike, y pensaba que en algunos aspectos el 
trabajo de éste se había anticipado al suyo. 

En lo que concierne a su influencia en la psicología de los Estados Unidos, según 
testimonios de los mismos psicólogos estadounidenses, Pavlov se encuentra junto 
a Freud y a Wundt (Coan y Zagona, 1962). Por lo tanto, compete al estudiante de 
la teoría del aprendizaje conocer algunos detalles acerca del científico creador de 
muchos de los conceptos de Ja psicología contemporánea, especialmente en el 
campo del aprendizaje. 


LECTURAS COMPLEMENTARIAS 


Las siguientes fuentes inglesas abarcan la mayor parte de los mejores escritos de Pavlov: 


Pavlov, 1. P., Condilioned reflexes, 1927. 

Pavlov, 1. P., Lecheres on condifioned reflexes, 1928. 

Pavlov, 1. P., Condifioned reflexes and psycimatry, 1941. 
Pavlov, 1. P., Selected works, 1955. 

Pavlov, L P., Experimental psychology und other essays, 1957. 


Como una breve introducción al trabajo de Pavloy, se recomienda al lector interesado 
ucuparse de sus propios resúmenes. Su primer ensayo (1903) “Experimental psychology 
and psychopathology in animals” tiene la calidad de los posteriores; esto podrá verse en 
Pavlov (1928), págs. 47-60 y en Pavlov (1955), págs. 245-70. Se encontrará un capítulo es- 
crito por un fiel seguidor de Pavlov, Gantt, W. H. (1965), '"Paylov's system,'' en B,B. 
Wokman y E. Nagel (dirs.), Scientific psychology (1965), págs. 127-29, 

Entre los libros que continuaron dentro de la tradición experimental iniciada por Pavlov, 
pero que hicieron sus propias contribuciones, se encuentran: 


Bykov, K. M. The cerebral cortex and the interna! orgens, 1957. 

Gray, J. A. (dir.), Pavtov's typology, 1964. 

Konorski, J., Conditioned reflexes and neuron organization, 1948. 

Luria, A. R., Higher cortica! functions in man, 1966. 

Razran, G., Mind in evolution: An EasiWest synthesis of learned behavior and cognifion, 
1971. 


Respecto al material biográfico acerca de Pavlov: 


Babkin, B. P., Pavlow: A biography, 1949. 
Frolov, Y. P., Pavlov and his school, 1937. 


Los siguientes libros demuestran que aún existe un gran interés en el paradigma condicio- 
nador clásica, a pesar de que en los laboratorios estadounidenses la experimentación se ha 
apartado de éste: 
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Black, A. y Prokasy, W.F. (dirs.). Classical conditioning 11, 1972. 

Estes, W. K. (dir.), Handbook of learning and cognitive processes; vol. 2: Conditioning and 
dehavior theory, 1975. 

Geis, G. L., Stebbins, W. C. y Lundin, R. W., Reflexes and conditioned reflexes: A basic 
systems program, 1965. 

Kimble, G. A., Hiigard and Marquis' conditioning and learning, 1961. 

Macintosh, N. J. y Honig, W. K. (dirs.), Fundamental! isswes in associative learning. 1971. 

Prokasy, W.F. (dir.), Classical conditioning: A symposium, 1985. 


4 


El condicionamiento 


contiguo 


de Guthrie 


En algunos aspectos, el sistema que propone Edwin R. Guthrie (1886-1959) se 
deriva de modo natural de los de Thorndike y Pavloy. Se trata de una psicologia obje- 
tiva de asociación de estímulo y respuesta, que emplea los términos de la respues- 
ta condicionada provenientes de Pavlov, al tiempo que es práctica y relevante a la 
manera de Thorndike. Pero en otros aspectos, las interpretaciones del aprendi- 
zaje son muy distintas: son estas similitudes y diferencias las que plantean proble- 
mas a la teoría del aprendizaje. 


GUTHRIE, THORNDIKE, PAVLOV, Y EL 
CONDUCTISMO 


Thorndike aceptaba dos tipos de aprendizaje: 1. selección de respuestas y cone- 
xión con los estímulos de acuerdo con la ley del efecto; y 2. cambio por asocia- 
ción, en el cual una respuesta a un estímulo varía hacia otro estímulo pareado con 
éste. Para Thorndike, el cambio por asociación es un principio subsidiario, y en 
gran medida el fundamental trabajo se lleva a cabo mediante la selección y la cone- 
xión (o aprendizaje por ensayo y error). Para Guthrie, por el contrario, una con- 
cepción corno el cambio por asociación devino la piedra angular de su sistema. 
Guthrie no acepta la ley del efecto en el sentido que le daba Thorndike, y ésta es 
la separación básica entre ambos sistemas. 

Guthrie fue un conductista de vanguardia. Suele pensarse que el conductismo 
como escuela psicológica se originó con John B. Watson (1878-1958), que en 1913 
postuló la posición conductista y se convirtió en su principal vocero durante varios 
años, hasta que su participación en un escándalo de adulterio lo obligó a renunciar 
a la academia y a aceptar un empleo en la publicidad comercial. Los conductistas, 
entonces y ahora, tenían y tienen en común la convicción de que una ciencia de la 
psicología debe basarse en el estudio de lo que es observable, los estímulos físicos 
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y los movimientos musculares y secreciones glandulares que esos estímulos pro- 
ducen. Los conductistas han diferido entre sí en cuanto a lo que pueda deducirse 
además de lo que se mide, pero todos excluyen la aútoobservación (introspección) 
como un legítimo método científico. (Sin embargo, si se estudia como conducta 
verbal, puede salvarse para la investigación gran parte de lo que se denomina in- 
trospección.) De cierta manera como protección contra un uso indirecto de la 
introspección, los conductistas tienden a preferir la experimentación con animales 
e infantes humanos. Se conciben a sí mismos como biólogos interesados por la for- 
ma en que se comportan los organismos en diversas circunstancias. 

La obra de Watson Behavior: An introduction to comparative psychology (1914) 
fue el primer texto que siguió a la publicación de su nueva posición, En él intenta 
refutar la ley del efecto, de Thorndike, y sustituirla por las leyes de la frecuencia y 
de la recencia. Creía que el aprendizaje animal, como en el laberinto o en la caja- 
problema, podría explicarse de acuerdo con lo que se había llevado a hacer al 
animal con mayor frecuencia en esa situación, y donde el acto más reciente se re- 
cordaba mejor. Como el acto exitoso era el más frecuente y el más reciente 
(ocurría al final de cada ensayo en la caja-problema), su recurrencia en el siguiente 
ensayo podía explicarse sin acudir a un principio agregado de efectos recomper- 
santes. Esta negación del efecto era parte de su programa para deshacerse de la 
subjetividad residual —que consideraba implícita en los conceptos de Thornidke— 
de los satisfactores y las molestias. Aunque la teoría de la frecuencia-recencia no 


resistió las críticas (Gengerelli, 1928; Peterson, 1922), pone de relieve el deseo de 
Watson de encontrar leyes objetivas que sustituyesen a las que tuvieran incluso 
un leve tinte de subjetivismo. 

El conductista sabe qué otros eventos intervienen entre los estímulos medidos 
y la respuesta a éstos. A fin de preservar una posición coherente, se postula que 
estos eventos intervinientes son muy parecidos a los observados; es decir, los 
pensamientos o las expectativas se representan como secuencias ismplícitas o en- 
cubiertas de estímulo y respuesta, En sus primeros estudios acerca del aprendizaje 
de hábitos de laberinto por parte de las ratas, Watson (1907) atribuyó gran impor- 
tancia a los estímulos kinestésicos como integradores de los hábitos intervinientes 
enel recorrido del laberinto. Como los estímulos kinestésicos ocurren durante los 
movimientos del organismo, encajan muy bien en una psicología conductual u orien- 
tada a la respuesta. Los procesos no observados que se infíeren ocurren entre los 
estímulos y las respuestas, y constan de movimientos subliminales y de estímulos 
producidos por movimiento. 

Este acento en la kinestesia como integradora del aprendizaje animal le fue muy 
útil a Watson cuando teorizó acerca de los procesos del pensamiento humano. De- 
cidió que el pensamiento era fundamentalmente una cuestión de lenguaje implícito; 
es decir, de hablarse a sí mismo. Conjeturó que instrumentos suficientemente 
sensibles detectarían los movimientos de la lengua o cualquier otro movimiento 
que acompañara al pensamiento. Desarrollos técnicos posteriores apoyaron par- 
cialmente a esta ''respuesta en miniatura”” que acompaña al pensamiento (véanse 
las reseñas en McGuigan y Schoonover, 1973). Watson logró así sostener la con- 
sistencia de su posición conductista sin negar que el pensamiento sigue en marcha. 
Más tarde comprendió que el reflejo condicionado de Pavlov servía como un para- 
digma útil para el aprendizaje (Watson, 1916). Como se desarrolló a partir de la 
tradición objetiva de la fisiología rusa, se ajustaba a su temperamento y lo adop- 
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tó con entusiasmo. En sus últimas obras, el reflejo condicionado era central para el 
aprendizaje, en tanto unidad a partir de la cual se forman los hábitos. 

El texto general de Watson, Psychology from the standpoint of a behaviorist, se 
publicó en 1919, y muy pronto le siguieron otros libros escritos desde una pers- 
pectiva declaradamente conductista. Entre ellos se cuenta la obra de Smith y 
Guthrie General psychology in terms of behavior (1921). A la manera de Watson, en 
el texto se enfoca a la psicología desde un punto de vista conductual, y se utilizan los 
principios del condicionamiento. También se recalcan los estímulos producidos por 
el movimiento como el sustrato de una gran parte de la acción habilidosa. Smith y 
Guthrie mostraban menos interés que Watson en los detalles experimentales y 
neurofisiológicos, y en su lugar presentaban una plausible interpretación de la ex- 
periencia ordinaria desde la perspectiva conductista. Las obras posteriores de 
Guthrie preservan los lineamientos del libro que escribiera conjuntamente con Smith. 

Indudablemente influido por Watson, Guthrie comenzó a usar el lenguaje del 
condicionamiento en su psicología conductista, pero prefirió emplear lo que se co- 
nocía acerca de los reflejos condicionados de una manera muy distinta de la de 
aquél. Watson utilizaba el experimento de Pavlov como un paradigma del aprendi- 
zaje, y para él la unidad del hábito era el reflejo condicionado, alrededor del cual 
construyó todo su sistema, A diferencia de Watson, Guthrie, empezó con un prin- 
cipio de condicionamiento o aprendizaje asociativo, principio que no depende es- 
trictamente del tipo de experimento de Pavlov. De hecho, este último criticaba a 
Guthrie por su énfasis en el principio de la contigúidad, sin preocuparse lo bastan- 
te por las numerosas complejidades dentro del condicionamiento (Pavlov, 1932). 
Guthrie (1934) respondió que Pavloy defendía una forma de aprendizaje suma- 
mente artificial, y que lo que se había descubierto en sus experimentos debía ex- 
plicarse de acuerdo con un principio más general. 


CONTIGUIDAD DE INDICIO Y RESPUESTA: ÚNICA 
LEY DE LA ASOCIACIÓN 


La única ley del aprendizaje de Guthrie, a partir de la cual se comprendería todo 
lo referido al aprendizaje, se estipula en los siguientes términos: *“Una combi- 
nación de estímulos que estuvo acompañada por un movimiento, al repetirse tien- 
de air seguida de ese movimiento” (1935, pág. 26).: 

Hay una elegante sencillez en ese enunciado, en el cual no se mencionan los im- 
pulsos, las sucesivas repeticiones, las recompensas o los castigos; estímulos y 
movimientos en conjunción simultánea: eso es todo. Este principio sirve de funda- 
mento a una teoría del aprendizaje ingeniosa y cautivante, 

Se necesita de un segundo enunciado para completar los postulados básicos 
acerca del aprendizaje: *“*Un patrón de estímulo cobra toda su fuerza asociativa 
cuando se parea por primera vez con una respuesta'” (1942 pág. 30). Es decir, el 
aprendizaje debería producirse en un solo ensayo, a manera de todo o nada, 

Esta declaración un tanto paradójica, en vista del mejoramiento innegable en los 
hábitos gracias a la práctica, es un aditamento necesario para la teoría, ya que per- 


1Cuando las citas de Guthrie permanezcan inalterables entre las ediciones de 1935 y 1952 de su li- 
bro, sólo se citará la primera. 
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mite enunciar algunos postulados derivados acerca del aprendizaje y el olvido. 
Veamos cómo explicaba Guthrie el aprendizaje gradual. 

Tales postulados plantean un cierto principio de recencia, ya que si el aprendizaje 
ocurre por completo en un ensayo, aquel que se produjo en último término (el más 
reciente) en presencia de una combinación de estímulo será el que se lleve a cabo 
cuando la combinación de estímulo ocurra de nuevo. Es así que este principio pro- 
pone que la interferencia retroactiva (véase capítulo 6) se completaría en un ensayo. 

¿Cómo podría Guthrie demostrar que las formas más complicadas del aprendi- 
zaje se ajustan a estos simples principios? Su problema consiste en demostrar que 
el aprendizaje complejo o el aprendizaje de discernimiento e intencional puede de- 
nvarse de estos principios básicos, junto con suposiciones auxiliares. La tarea de 
Guthrie consistía en demostrar que cada una de estas formas no requiere de nue- 
vos principios de explicación, más allá de la ley primaria de la asociación por conti- 
gúidad. 


Por qué no es esencial la estricta contigúidad del 
estímulo y la respuesta medidos 


Una variable importante en los experimentos de condicionamiento estándar es 
el intervalo temporal que media entre el estímulo condicionado y la respuesta in- 
condicionada. Como vimos en la figura 3.5, los resultados empíricos sugieren un 
gradiente, con un intervalo más favorable e intervalos menos favorables a ambos 
lados de ese intervalo óptimo. Éste oscila entre medio y varios segundos, lo cual 
depende del sistema de respuesta condicionada y de Ja medición del condiciona- 
miento. 

Guthrie defendió la estricta simultaneidad del estímulo y la respuesta frente a 
tales datos a proponer que el estímulo que se condiciona no es el estímulo que se 
mide. Un estímulo externo da lugar a movimientos del organismo que, a Su vez, 
producen estímulos kinestésicos. Cuando parecen formarse asociaciones entre los 
estímulos y las respuestas separadas en el tiempo, se debe a que tales movimien- 
tos intervinientes llenan el vacío: la verdadera asociación se da entre eventos si- 
multáneos. (Este análisis en realidad no explica el hecho de que un intervalo EC- 
El de longitud intermedia es el óptimo para el aprendizaje; véase la figura 3.5.) Se 
usaría el mismo análisis para explicar cómo aprende un animal a demorar delibera- 
damente su respuesta a una señal, a fin de obtener la recompensa; la señal activa 
una cadena de conductas postergadas que introducen al animal directamente al 
punto de reforzamiento. 

En el sistema de Gutlvie hay una marcada preferencia por los estímulos produ- 
cidos por movimiento como los verdaderos condicionadores. Éstos permiten la in- 
tegración de los hábitos dentro de una amplia gama de cambios ambientales y de 
estimulación, ya que el mismo organismo transmite estos estímulos. Como hemos 
visto, parte de esta preferencia se remonta al énfasis inicial de Watson (1907) en 
la kinestesia como base del control del hábito del laberinto, una posición que ya no 
es sostenible.? Tales estímulos encubiertos pruducidos por el movimiento generan 


2Honzik (1936) descubrió que la kinestesia era uno de los controles sensoriales menos útiles en el 
hábito del laberinto. 
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explicaciones instantáneas acerca de la conducta que no pueden inferirse de las re- 
laciones externas de estímulo y respuesta. Desafortunadamente, constituyen una 
base muy débil para fundamentar la posición de un conductista. 


Por qué la repetición produce mejoramiento 


Guthrie tenía dos maneras de inferir el aparente mejoramiento gradual, una de 
ellas basada en la variabilidad de ensayo-a-ensayo én el estímulo exacto presen- 
te para la respuesta, y la otra sustentada en la complejidad de la conducta total 
agrupada como la “'respuesta”* de interés. Según este segundo argumenta, la razón 
por la cual la práctica da lugar al mejoramiento es que este último y otras formas 
de éxito se refieren a actos, a resultados de aprendizajes, más que a los pequeños 
detalles de los movimientos. Guthrie creía que su preferencia por los peque- 
ños componentes de los patrones del movimiento, y de la predicción de movi- 
mientos, era casi única entre los teóricos del aprendizaje; decía que otros se inte- 
resaban en los grandes logros y en los resultados a gran escala de un tipo u otro. 
Se diferenciaba de Thorndike, por ejemplo, en que éste se inclinaba por las pun- 
tuaciones de sus sujetos en tareas: por palabras aprendidas, páginas escritas a 
máquina o respuestas correctas. Guthrie prefería los detalles nos de movimiento 
del organismo, independientemente de que condujeran al error o al éxito. 

Una habilidad —como la de meter una pelota en la red en un juego de balon- 
cesto— no es sólo un acto sino muchos. No depende de un solo movimiento mus- 
cular sino de un cierto número de movimientos realizados en cierto número de circuns- 
tancias distintas. Cualquier movimiento puede aprenderse en cualquier ensayo, 
pero aprender todos jos movimientos que requiere esa complicada habilidad 
necesita de la práctica en las diferentes situaciones: cerca y lejos del cesto, en un 
lado y en el otro, con una defensa cerca o sin ella. La práctica es necesaria; pero 
tiene sus consecuencias, no según una ley de frecuencia sino de acuerdo con el 
simple principio de la vinculación de indicios a movimientos. Cuanto más variados 
sean los movimientos necesarios para ejecutar un acto dado de habilidad, y cuanto 
más lo sean los indicios que deben asimilarse con estos movimientos, más práctica 
se requerirá. No hay ningún misterio alrededor del tiempo que ínsume aprender a 
usar una máquina de escribir: hay tantas teclas en tantas combinaciones que re- 
quieren de la vinculación de muchísimos indicios a una gran cantidad de respuestas. 
Concomitantemente, es necesario deshacerse de las asociaciones equivocadas 
que conducen a lo que desde el punto de vista del logro constituye un error. Esto 
se obtiene al hacer que la conducta correcta se produzca frente al indicio que antes 
dio lugar a la conducta errónea. Cuando por último todos los indicios conduzcan a 
conductas aceptables la tarea se ha dominado. La aparente contradicción entre el 
aprendizaje de un solo ensayo y la experiencia real de dolorosos desaciertos antes 
del éxito se resuelve cuando la tarea de habilidad se considera compuesta de un 
gran número de hábitos, 

Como hemos dicho, incluso cuando una respuesta aparentemente simple (como la 
salivación) debía aprenderse para un EC simple como una campana, Guthrie invocó 
la variabilidad de ensayo a ensayo en el estimulo preciso para el animal: el perro po- 
dría cambiar de postura, abrir o cerrar los ojos, sufrir un piquete de pulga que lo irri- 
tara en algunos ensayos, escuchar un ruido aislado fuera del laboratorio, etcétera. 
Suponiendo que estos elementos de estimulo son activos en algunos ensayos e 
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mactivos en otros, que sólo los elementos activos determinan la respuesta y pue- 
den ser condicionados en un ensayo dado, la teoría es capaz de derivar una curva 
de aprendizaje gradual incluso para una situación de condicionamiento simple. Es- 
tas premisas son exactamente las que fundamentan la teoría de! muestreo de estí- 
mulo, de Estes, que se examinará en el capítulo 8. 


Interferencia asociativa, olvido y ruptura de hábitos 


La extinción es uno de los resultados de los experimentos de condicionamiento 
que requiere de explicación. Como las respuestas deberían permanecer fieles a 
sus indicios, Guthrie no podía estar de acuerdo en que la extinción constituye una 
disminución en la fuerza del hábito debida a la mera repetición no reforzada. En su 
opinión, la extinción siempre es un resultado de la competencia o interferencia aso- 
ciativa; es decir, se produce mediante el aprendizaje de una respuesta diferente 
de la situación de estímulo e incompatible con ella. La suya es una teoría de la in- 
terferencia y por ende no requiere de principios nuevos, ya que el aprendizaje ori- 
ginal y el de interferencia siguen las mismas reglas, Su teoría nos lleva a buscar 
nuevos estímulos, presentes en la extinción, que no fueron condicionados durante 
el entrenamiento, en tanto, éstos servirían para provocar respuestas distintas de 
la RC. 

Por ejemplo, durante la adquisición, por lo general el EC aparecía en presen- 
cia de huellas de estímulos del Ef y del Rf del ensayo inmediatamente anterior; 
sin enhargo, estas huellas del El y de la RI por lo común están ausentes durante 
h extinción, y por eso la huella EC-sin-EJ forma un nuevo patrón que podría evo- 
car alguna respuesta incompatible con la RC. Y de acuerdo con el postulado del 
aprendizaje de un ensayo, ese pareamiento basta para condicionar la respuesta 
competidora al EC. 

Guthrie explica el olvido de la misma manera. Si no hubiera interferencia con el 
aprendizaje antiguo, no se produciría el olvido. Esta posición es una forma extre- 
ma de la teoría de la inhibición retroactiva del olvida, que se verá en el capítulo 6. 
Por ejemplo, se ha demostrado que las respuestas candicionadas, aun cuando en 
algunos aspectos parezcan frágiles, son en realidad muy resistentes al olvido 
(Hilgard y Carnpbell, 1936; Skinner, 1950; Wendt, 1937). El carácter de larga du- 
ración de muchas respuestas condicionadas en el laboratorio puede entenderse 
como intrínseco al aprendizaje sumamente específico de indicios a los que el indi- 
viduo no se enfrenta en la vida cotidiana, fuera de la situación experimental: si vi- 
vieran en esa situación, sus respuestas estarían sujetas a mayor número de inter- 
ferencias. Además, en el experimento típico de condicionamiento, la persona se 
somete a una gran cantidad de ensayos para asociar un EC particular con un solo 
EL. Sin lugar a dudas, se suscitaría mucho más olvido de las RC simples con menos 
práctica y aprendizaje concurrente de, digamos, veinte EC diferentes pareados 
con la presencia o ausencia de diez distintos EJ. Esto se aproxima más a la com- 
plejidad de la tarea de las asociaciones verbales múltiples, que se sabe, conduce a 
un gran olvido. 

Si se desea romper un hábito (es decir, acelerar su sustitución) sólo es nece- 
sario causar contramovimientos que se produzcan en presencia de los indicios 
para el hábito. El problema de localizar los indicios y de reemplazar la contracon- 
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ducta a menudo insume tiempo, ya que muchos indicios pueden conducir a un hábi- 
to indeseable. 


El hábito de beber o de fumar después de años de práctica constituyen sistemas de 
acción que pueden ponerse en marcha con miles de recordatorios, .., Una vez tuve un vi- 
sitante a quien le expliqué que la manzana que acababa de comer era un dispositivo es- 
pléndido para no fumar un cigarrillo, El visitante observó que en ese momento yo estaba 
fumando, El hábito de encender un cigarrillo estaba tan vinculado con la terminación de la 
comida, que lo había iniciado automáticamente (Guthrie, 1935, pág. 139). 


Guthrie sugería tres métodos mediante los cuales comúnmente las actividades 
se debilitan:? 

1. El primero consiste en introducir el estímulo que deseamos eliminar, pero 
sólo en un grado muy leve que no provoca respuesta. Este es el método para 
acostumbrar a un caballo a portar la silla de montar: se comienza con una manta li- 
gera y gradualmente se agrega el equipo completo, sin permitirle que se asuste y 
se ponga molesto o nervioso, Se trata del método de tolerancia, ya que presenta al 
FC exactamente en aquel nivel (el umbral presente) que el sujeto tolera sin evo- 
car la respuesta, y entonces el estímulo crítico se eleva de forma gradual. 

2. El segundo consiste en repetir la señal completa que la respuesta original se 
agote, y entonces continuarla, de modo que se aprendan nuevas respuestas para 
la señal. Los domadores de potros de los ranchos del oeste estadounidense aplica 
ban esencialmente esta técnica; se le denominaba método de agotamiento o de sa- 
turación, 

3. El tercero consiste en presentar el estírmio cuando otras características en 
la situación inhiban la respuesta indeseable. Un ejemplo que Guthrie proporciona 
es el de entrenar a un perro para que no atrape y se coma a las gallinas, atándole 
una muerta al cuello. A medida que la lucha por librarse del animal muerto, el pe- 
rro desarrolla una respuesta de evitación de las gallinas. Otro ejemplo, que ilustra 
el aprendizaje mal adaptado, es la desobediencia que aprende el niño cuya madre la 
llama cuando está demasiado ocupado para obedecer. A esto se le denominaba 
contracondicionamiento. 

Los psicoterapeutas modernos han recogido y aplicado con mucho ingenio estas 
técnicas para romper los hábitos indeseables, al ayudar a sus pacientes a superar 
problemas debilitantes de tipo emocional y conductual. Un ejemplo es lo que se 
denomina desensibilización sistemática (Wolpe, 1958), que se emplea para aliviar 
(extinguir) las ansiedades o fobias severas de un paciente respecto de alguna si- 
tuación. Un caso típico sería el de un hombre de negocios que desea superar una 
fobia debilitante a viajar en avión, Con el paciente, el terapeuta identifica primero 
una jerarquía, o serie graduada, de situaciones ordenadas de acuerdo con su cer- 
canía psicológica al suceso temido, en este caso, volar. Éstas podrían incluir situa- 
ciones distantes que evoquen una cierta ansiedad, como la lectura de folletos rela- 
cionados con viajes aéreos, el sostener un avión de juguete u observar a alguno 
que sobrevuela el lugar; a cosas más cercanas, como ir en automóvil al aeropuer- 
to, entrar en él, acercarse al mostrador de control, hablar con la azafata, subir por 
la escalerilla del avión, entrar y caminar en él, sentarse mientras permanece inmó- 
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vil, quedarse adentro del aparato mientras se desliza por la pista, hacer vuelos 
cortos, emprender vuelos más largos, volar en condiciones de turbulencia, etcéte- 
ra. El paciente clasifica los aspectos en esta jerarquía de generalización, de acuer- 
do con la ansiedad que le producen. 

En la segunda fase, el terapeuta enseña al paciente las técnicas de relajamiento 
profundo de Jos músculos; esto es, cómo relajarlos por completo, cómo someter 
el relajamiento al contral verbal casi inmediato (decir “relájate”* como en EC para 
un patrón de respuesta de relajamiento), y cómo discriminar cuándo el paciente 
está tenso y cuándo relajado. 

En la tercera fase, el miedo que siente el paciente al imaginar las diversas situa- 
ciones en su jerarquía de estímulo, se extingue mediante una combinación de mé- 
todos de tolerancia y contracondicionamiento. Mientras se encuentra profunda- 
mente relajado, se le pide que imagine la situación que le produce el menor miedo 
en sujerarquía (por ejemplo, pedir boletos). Esto se hace en la imaginación duran- 
te varios ensayos de extinción, entonces se repite con el elemento siguiente, que 
provoca un miedo mayor de acuerdo con dicha jerarquía, y así sucesivamente, El 
paciente avanza al segundo elemento de la serie sólo si puede permanecer com- 
pletamente tranquilo y relajado mientras se imagina en esa situación. Después de 
varias sesiones terapéuticas de una hora con este procedimiento, se imaginará a sí 
mismo en la situación fóbica pero sin experimentar miedo. 

Cuarto, si es posible, junto con el contracondicionamiento imaginario en el con- 
sultorio del terapeuta, al paciente se le conduce también a través de una serle gra- 
duada de situaciones de la vida real, dispuestas en un orden jerárquico de miedo 
que conduce hasta la actividad a la que antes se temía más. Por ejemplo, el tera- 
peuta podría acompañar al paciente al aeropuerto, mientras éste conversa con una 
azalata, se sienta dentro del avión, etcétera. Durante estas actividades, el tera- 
peuta instaría a) paciente a permanecer tranquilo y lo reforzaría verbalmente. Ín- 
cluso si no pudieran arreglarse estos ensayos, la extinción del miedo en la situa- 
ción imaginaria todavía se transfiere sustancialmente a la situación de la vida real, 
donde el miedo del paciente se reducirá. 

Enla actualidad, este procedimiento para la extinción de fobias es uno de los re- 
cursos más comunes en el arsenal de los terapeutas de la conducta. Wolpe (1958) 
y muchos otros investigadores han informado de tasas elevadas de “*curación”' 
con el procedimiento aplicado a una diversidad de fobias, como el temor a las altu- 
ras, alos animales, a hablar en público, a hacer un examen, a permanecer al aire li- 
bre, a los automóviles, a los encuentros sexuales, etcétera. En el laboratorio se 
han estudiado los componentes de este procedimiento clínico usando las fobias de 
localización commín en estudiantes universitarios: miedo excesivo a las serpientes, 
alas arañas, a hablar en público, etcétera. Este procedimiento, indudablemente 
útil en la eliminación de un elevado porcentaje de fobias indeseadas, tiene dos 
componentes: al comienzo el miedo es provocado sólo por un indicio muy débil, y 
el indicio imaginario también se parea con el relajamiento profundo. Se presume 
que la ““respuesta”” de relajamiento es antagónica a la reacción de ansiedad (*'in- 
hibe recíprocamente” el miedo). Por lo tanto, teóricamente, el indicio débil se co- 
necta con la respuesta de relajamiento. Debido a la generalización del estímulo, la 
ansiedad-inhibición condicionada al indicio más débil también reducirá el miedo 
provocado por el siguiente indicio en la jerarquía, y éste también puede ser cubier- 
too reemplazado por la respuesta antagónica de relajamiento. La idea es que si los 
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indicios se introducen en progresión lenta, podríamos extinguir óptimamente la 
reacción fóbica en toda la jerarquía de estímulos, sin la reacción de ansiedad que el 
paciente había experimentado antes. 

Cabría preguntarse cómo se comparan los diversos métodos de extinción; por 
ejempto, en su efectividad para reducir un hábito EC-R.C dentro de un mámero de- 
terminado de ensayos o un periodo fijo de tiempo. Poppen (1968) proporcionó una 
primera comparación de varias técnicas puras y sus combinaciones para extinguir 
en ratas el miedo evocado por un tono que se había pareado con una descarga 
eléctrica. Descubrió que la técnica de tolerancia-más-contracondicionamiento era 
la de mayor eficacia, mientras que el procedimiento de extinción típico (la mera 
presentación breve del EC sin descarga eléctrica) era el menos eficiente. Diferen- 
tes fobias neuróticas pueden desaparecer a partir de distintos métodos. Así, 
Rachman, Hodgson y Marks (1971) encontraron que la saturación es el método más 
efectivo para reducir las compulsiones obsesivas (como la de lavarse las manos). 
Bandura (19775) descubrió que el alentar al paciente a responder abiertamente a 
una jerarquía graduada de estímulos amenazantes conducía a una extinción más rá- 
pida de la fobia a las serpientes, que el método de imaginar sencillamente esas ac- 
tividades. Estas son tan solo algunas de las secuelas de la especulación de Guthrie 
en torno a la mera de romper los hábitos. 


LAS APRECIACIONES DE GUTHRIE ACERCA DE 
LA MOTIVACIÓN, LAS INTENCIONES, LAS 
RECOMPENSAS Y EL CASTIGO 


Motivo 

El estado motivacional del organismo, el hambre, la sed, o su estado de como- 
didad o incomodidad, carecía de un lugar formal en la teoría del aprendizaje de 
Guthrie; el estado motivacional únicamente es relevante porque determina la pre- 
sencia y el vigor de los movimientos que puedan conformar conexiones asociati- 
vas. El motivo sólo es importante para las secuencias de estímulo-respuesta que 
acurren, específicamente las secuencias de respuesta consumatoria como comer, 
beber, aparearse, etcétera. Los movimientos que se suscitan se asocian a los inde 
cios coincidentes; si un gato hambriento actúa de modo distinto que uno bien alimen- 
tado, sus movimientos son diferentes y su aprendizaje también puede serlo. Aprende 
lo que hace y esto es más importante que su estado motivacional en ese momento. 

Sin embargo, los motivos son primordiales para proporcionar estímulos de man- 
tenimiento, que tienen al organimso activo hasta que alcanza una meta, la cual eli- 
mina dichos estímulos y concluye con la actividad (Guthrie, 1942, pág. 18). Guth- 
rie creía que estos estímulos tienden a mantener integrada una serie de actos, y 
explican la expectativa de los objetos meta (por ejemplo, comida para satisfacer 
el hambre), por la conducta caracterizada por intención o propósito. 


Intención 

Al parecer la conducta se organiza en secuencias en las cuales las personas (o 
los organismos inferiores) formulan planes y los llevan a la práctica, o al menos co- 
mienzan a ejecutarlos. Guthiie era consciente de esto y examinó el aprendizaje 
con intención y sin ella (1935, págs. 202 a 211). Su posición consistía en analizar la 
planeación en términos de mecanismos E-R. 
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Él y Smith adherían a los lineamientos de Sherrington y Woodworth de consi- 
derar a las secuencias de conductas como si estuviesen compuestas de respuestas 
preparatorias seguidas de respuestas consumatorias (Smith y Guthrie, 1921; 
Sherrington, 1906; Woodworth, 1918). Desde el exterior estos actos parecen ser 
intencionales, ya que los primeros ajustes están claramente preparados para las 
consecuencias que seguirán. Se dice que estas respuestas anticipatorias o reaccio- 
nes de preparación están condicionadas a estímulos de mantenimiento. 

El caso típico es el de una rata hambrienta que corre por un pasadizo estrecho 
hacia la comida situada en uno de sus extremos. La actividad se mantiene median- 
te los estímulos internos excitados por la privación de alimento, a los cuales la con- 
ducta de correr y comer ya ha sido condicionada. Es decir, la rata encontró comida 
en algún momento anterior a esta situación después de correr mientras tenía ham- 
bre. Tales estímulos internos, aunados a los estímulos del pasadizo (si éste condu- 
jo antes al alimento), mantienen la conducta de correr en contra de respuestas 
competidoras, como la de detenerse a explorar. La salivación anticipada o los mo- 
vimientos de mascar imprimen carácter direccional al comportamiento. Toda la 
expectativa de alimento se cumple sj hay comida al final del laberinto. Como los 
estímulos del hambre y de la anticipación se han elimidado y al animal se le retira 
del laberinto, todo el aprendizaje queda intacto para un ensayo posterior. Este pa- 
radigma proporciona un medio para que también nos refiramos a las intenciones y 
propósitos del ser humano. 


La esencia de una intención es un conjunto de estímulos de mantenimiento que pueden 
o no incluir fuentes de inquietud como la sed o el hambre, pero que siempre incluyen ten- 
dencias de acción condicionadas durante una experiencia pasada: una disposición favorable 
para hablar, para ir, para leer, y en cada caso un estado de preparación no sólo para el acto 
sino también para sus consecuencias previamente ensayadas. Estas actitudes favorables 
no son actos completos, sino que consisten en tensiones de los músculos que interven- 
drán en el acto completo (Guthrie 1935, págs. 205-206). 


Esta declaración se acerca considerablemente al punto de vista que aceptan au- 
tores con teorías muy distintas acerca del aprendizaje. La única característica que 
la mantiene dentro de los límites de la teoría de Guthrie es que la totalidad de los 
estados de preparación, incluyendo el de preparación para las “consecuencias 
previamente experimentadas del acto””, se considera como tensiones de los mús- 
culos. Esta premisa, característica de la posición conductista acerca de los even- 
tos cugnoscitivos, pertenece al campo de la conjetura más que al de la evidencia. 


Recompensa 

Aunque como casi todo el mundo Guthrie creía que las recompensas influyen 
enlos resultados, su rechazo de la ley del efecto y del principio del reforzamiento en 
el condicionamiento se basa en la posición de que no hay nada nuevo que se sume 
al aprendizaje asociativo por recompensas, a excepción de un tipo particular de arre- 
glo mecánico. Este arreglo, que coloca la recompensa al final de una serie de 
actos, aparta al organismo de los estímulos (tanto internos como externos) que ac- 
túan justo antes de la recompensa. Por lo tanto, como la respuesta recompensada 
es la última en ocurrir al culminar un ensayo, las respuestas competidoras no tie- 
nen oportunidad de producirse frente a los estímulos del aparato, y así desplazar a 
la respuesta (correcta) final. En vez de que la recompensa fortalezca a la conduc- 
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ta, la protege contra la formación de nuevas asociaciones a los mismos estímulos. 
La respuesta exitosa era igualmente fuerte antes de que ocurriese la recompensa, 
pero si no ha habido ninguna recompensa, se habría evocado una nueva conducta 
en la misma situación, lo cual da lugar al desplazamiento de la respuesta correcta 
por otras irrelevantes que se asociarían con los estímulos experimentales. El acto 
que conduce a la recompensa, como es el último en la situación problema, es el fa- 
vorecido cuando la situación se repite. Guthrie era muy explícito en torno a esta 
cuestión. Acerca de un animal que escapaba de una caja problema decía: 


La posición que se asume en este artículo es que el animal aprende a escapar con su primer 
escape. Este aprendizaje está protegido del olvido porque el escape aleja al animal de la si- 
tuación en la cual no tiene oportunidad de adquirir nuevas asociaciones. 

(Acerca de la apertura del cerrojo seguida de comida.) Encontrar la comida no intensifica 
una forma previa de comportamiento, sino que la protege de no ser uprendida. La comida 
cambia de tal modo toda la situación y la acción del animal, que la situación previa a la co- 
mida es protegida de nuevas asociaciones. Éstas no pueden establecerse sino en el inte- 
nor de la caja, y en ausencia del comportamiento que antecedió a la apertura del cerrojo 
(1940, págs. 144-145). 


Aunque ésta es la posición fundamental en lo que respecta a la recompensa, y 
fue frecuentemente reiterada en oposición a la ley del efecto e interpretaciones 
relacionadas con ella, cuando examinamos la totalidad del sistema de Guthrie se 
advierte que la recompensa es un tanto más complicada. El primer (y primordial) 
papel de la recompensa consiste en sacar al animal de la situación problema y así 
evitar el no aprendizaje. Pero debido al principio de la asociación, el animal tam- 
bien aprende la actividad que ejecuta en presencia de la recompensa (por ejemplo, 
mascar y salivar frente a la comida), y este comportamiento tiende a ser evocado 
por el hambre renovada y por cualquiera de los indicios de la situación de condicio- 
namiento que pueden haber persistido mientras tenía lugar el comportamiento 
recompensado. 


+ . Sin embargo, hay un ¿cto para el cual el hambre permanece como un condicionador 
constante: el acto de comer; y la constancia del hambre a esta asociación se deriva del he- 
cho de que el hambre desaparece al comer. Como Stevenson Smith y yo señalamos ea 
nuestra obra General Psychology, los elementos de la respuesta consumatoria tienden a 
estar presentes en toda una serie de acciones impulsadas por un estírmilo de manteni- 
miento (1935, págs. 151-152). 

Las contracciones del hambre no sólo tienden a excitar a los movimientos generales de 
comer, sino que los movimientos específicos que exige la naturaleza particular del aimento 
son posibles de modo manifiesto. Así, cuando la rata corre por el laberinto está lista para 
cualquier recompensa que haya recibido en el pasado, semillas de calabaza o masa de sab 
vado. Esta disposición favorable es una disposición muscular real... (1935, pág. 173). 


Guttuie estipula aquí algunos aspectos de la hipótesis de la reducción del impul- 
so: las recompensas (al menos al comer) actúan al cambiar los estados de impulso 
internos (se eliminan los indicios de hambre), y algunos aspectos de la inter- 
pretación **de recompensa anticipada'* de la acción del reforzamiento. La interpre- 
tación de Guthrie acerca de la recompensa es al mismo tiempo ambigua, pro- 
vocativa, y una fuente de frecuentes ataques a su posición. Algunos eventos 
reforzantes se interpretan claramente en términos del cambio de estímulo a 


Cap. 4. El condicionamiento contiguo m1 


continuación de la respuesta crítica. Por ejemplo, en el aprendizaje humano por 
asociación, el sujeto generalmente ensaya la respuesta correcta a cada estímulo 
antes de que se presente el siguiente reactivo, con lo cual se asegura que la res- 
puesta correcta era la última al estímulo antes de que éste cambiara. O, en una si- 
tuación de aprendizaje de evitación, los animales aprenden más rápido cuanto ma- 
yor sea el cambio en la situación atemorizante inmediatamente después de que res- 
ponden (Bower, Starr y Lazarovitz, 1965). El problema con las situaciones que 
implican cambio de estímulo como recompensa es que pueden interpretarse con 
facilidad mediante otras teorías. Así, por ejemplo, una teoría que presupone que 
las respuestas de evitación son reforzadas por la reducción de la ansiedad, tam- 
bién podría manejar los resultados: cuanto mayor fuera el cambio alejándose del 
EC directamente condicionado al miedo, mayor sería la pérdida del miedo debido a 
la generalización al estímulo posterior al RC por lo tanto, mayor sería la reducción 
del miedo y el reforzamiento a continuación de la respuesta. Así, tales resultados 
no proporcionan evidencia diferencial en favor de la hipótesis de reforzamiento de 
Guthrie. 

La hipótesis de Guthrie sugiere una variedad de operaciones experimentales 
que resultan no ser nada recompensantes. Podemos disponer ciertos cambios ra- 
dicales en el ambiente para que tengan lugar inmediatamente después de que una 
rata oprima una palanca, como el hecho de que reciba una descarga electrocon- 
vulsiva, o hacer que se habra el piso debajo de ella, agitar de repente la caja o ta- 
parla con vna bolsa de tela negra; eventos como éstos sencillamente no actúan 
como recompensas, aunque los psicólogos han argumentado que la teoría de 
Guthrie predice que deberían actuar como tales. Los guthrianos arguyen que es- 
tos eventos abruptos no parecen actuar como recompensas porque provocan 
respuestas competidoras que se condicionan a la situación e interfieren con la res- 
puesta instrumental, Pero raras veces se han medido las respuestas competidas 
cruciales para apoyar dichos argumentos. La estabilidad esencial de la hipótesis 
del cambio de estímulo de la recompensa ha llevado a guthrianos contemporáneos 
a descartarla en favor de una excitación condicionada, o interpretación motivacio. 
nal de la acción de las recompensas. Esta teoría se examinará más adelante, en 
este mismo capítulo. 


Castigo 

Según Guthrie, la primera interpretación del castigo es la misma que para cual- 
quier otra pizca (bit) de aprendizaje asociativo: los organismos tienden a hacer lo 
que anteriormente hicieron en las mismas circunstancias. 


. ..Sentarse sobre tachuelas no desalienta al aprendizaje. Lo anima a uno a aprender, a 
hacer algo más que estarse sentado. Na es el sentimiento causado por el castigo, sino la 
acción específica que provoca la que determina lo que se aprender$. Para entrenar a un 
perro a saltar por un aro, la efectividad del castigo depende del lugar en que se aplique, si 
en el Írente o en la parte trasera. Lo que cuenta es lo que el castigo obliga a hacer al perro o 
a un hombre, no lo que le hace sentir (1935, pág. 158). 

Podemos predecir que la influencia de los estímulos que actúan en el momento de la sa- 
tisfacción o de la molestia servirá para restablecer cualquier conducta que fuera evidente 
en ese momento (1935, pág. 154). 


Si Guthrie se hubiese detenido en declaraciones de este tipo, habría parecido 
que trataba la recompensa y el castigo de forma simétrica. Sin lugar a dudas, el 
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castigo y la recompensa cambian una situación de modo muy notable. Por lo tanto, 
cabría inferir que toda la conducta que antecede permanecería intacta al ser prote- 
gida del nuevo aprendizaje mediante las condiciones alteradas del castigo, así 
corno por las condiciones alteradas de la recompensa. 

Como hemos visto en párrafos anteriores, la simetría en el tratamiento de la re- 
compensa y del castigo es un tanto ilusoria, ya que **hacer lo que usted hizo al Éi- 
nal'' alude a partes muy diferentes del ciclo de comportamiento, que dependen de 
si la referencia alude a la recompensa o al castigo. El “lo que usted hizo al final” 
que permanece en su repertorio conductual debido a la recompensa, es lo que us- 
ted hizo justo antes de que apareciese la recompensa: ''lo que usted hizo al final'* 
en el caso del castigo, se refiere a lo que hizo exactamente después de que comen- 
zara el castigo y en el momento de que concluyera con el escape. El castigo produ- 
ce estímulos de mantenimiento que se mitigan por un movimiento posterior que da 
lugar al alivio: 


+ « «Un animal en una rejilla electrificada, un muchacho descalzo en el pavimento calien- 
te, un hombre sentado sobre una tachuela, tienen como objetivo el escape de la intensa 
estimulación que causa tensión general e inquietud, así corno movimiento específico. Es- 
tos estímulos continúan actuando como lo que Stevenson Smith y yo denominamos estí- 
mulos de mantenimiento, hasta que algún movimiento aparta al sujeto de la fuente de es- 
timulación o ésta se retira del sujeto (1935, pág. 165). 


Cuando dichos estímulos se eliminan, estamos frente a las circunstancias que 
definen a la recompensa en la teoría de Guthne; si allí terminara todo, la conducta 
anterior permanecería intacta. A este tipo de alivio del castigo se le ha denomi- 
nado aprendizaje de escape para distinguirlo del aprendizaje de evitación, que tiene 
logar en previsión del estímulo nocivo. Para transitar del aprendizaje de escape al 
de evitación necesitamos una respuesta anticipatoria, condicionada a algún indicio, 
de modo que se eluda el castigo. El sistema de Guthrie se abastece de respues- 
tas anticipatorias, y éstas pueden usarse para explicar el aprendizaje de evitación. 
El animal tan sólo ejecuta la respuesta de escape a algún indicio presentado en el 
momento del castigo; un indicio que, afortunadamente, aparece antes del castigo 
temido. Ásí, lo que sucede al final de una secuencia de actos que conducen al casti- 
go hace algo además de, y aparte de remover al organismo de la escena; establece 
también algunas respuestas anticipatorias condicionadas. 

La idea de que la respuesta de evitación es una forma anticipatoria de la respuesta 
de escape provocada por el estímulo nocivo, tiene implicaciones al variar el valor de 
la verdad empírica. Un curioso conjunto de implicaciones se refiere a un grupo 
de estudios acerca de lo que se ha conocido como '*masoquismo experimental”, 
en el cual parece que una rata busca activamente recibir una descarga eléctrica 
(véanse Gwinn, 1949; Brown, 1969). Como siempre, este comportamiento termi- 
nal depende de una historia de entrenamiento particular. Por ejemplo, al animal se 
le entrena primero para que corra por un pasadizo largo —que tiene un piso de cel- 
dillas cargado eléctricamente— hasta que consiga llegar a la caja de seguridad ubr- 
cada en uno de los extremos. Entonces, cuando se encuentra en el pasadizo sin 
descarga en el piso, se le enseña a correr con rapidez hasta la caja de seguridad, a 
fin de evitar una descarga que se produce después de unos cuantos segundos. En 
esta fase, cuando el sujeto recibe una descarga se encuentra en el proceso de 
correr hacia la caja de seguridad, y el efecto de la descarga, cuando se suministra, 
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es el de empujar al sujeto para que corra todavía más rápido hacia la caja en cues- 
tión. Una vez que se ha establecido este patrón de correr, las contingencias pue- 
den alterarse de la siguiente manera: si la rata se sienta inmóvil cuando se le coloca 
en la caja inicial del pasadizo, no recibirá ninguna descarga y se le sacará de la caja 
después de 30 segundos; sin embargo, si se mueve a una pequeña distancia fuera 
dela caja, tocará la rejilla cargada eléctricamente y se ““castigará a sí misma”. Este 
entrenamiento basta para atrapar al sujeto en un círculo vicioso: se le ha enseñado 
acorrer antes de que sobrevenga la descarga, y a correr cuando la percibe. Por lo 
tanto, a pesar del cambio de contingencias desde el punto de vista del experimen- 
tador, desde la perspectiva del sujeto las contingencias (durante la “extinción cas- 
tigada'”) son las mismas que en el entrenamiento de evitación, siempre que siga 
corriendo. Las ratas pueden continuar con este comportamiento de autocastigo 
durante cientos de ensayos —como lo predice la teoría de Guthirie— hasta que en 
un ensayo aleatorio se sienten inmóviles en la caja inicial, o por casualidad regre- 
sen a la seguridad en lugar de seguir adelante al pisar la rejilla electrificada. Ocu- 
rridas estas respuestas, la '“extinción”” avanza precipitadamente, quizá en un en- 
sayo o en dos, como Guthrie también lo predijo (véase Dreyer y Renner, 1971). 

Sin embargo, en aparente oposición al análisis de Guthrie acerca del aprendizaje 
de evitación, podemos entrenar a animales y a personas para que den una res- 
puesta para evitar un evento nocivo, pero una respuesta distinta, que termine con 
ese estado de cosas, si llegara a presentarse, Por ejemplo, en previsión de un po- 
sible incendio en el hogar, contratamos seguros y revisamos la instalación eléctri- 
cay la del gas. Pero si la casa se quema, corremos a la salida más cercana o ayuda- 
mos a otras personas a escapar. Obviamente, discriminamos entre el peligro de 
que nuestra casa se incendie y el suceso real, y actuar de forma diferente ante él. 
En contextos menos complicados se ha demostrado que se puede entrenar a una 
rata para que dé una respuesta (erguirse sobre sus cuartos traseros) a fin de evi- 
tar una descarga cuando se oye un tono; pero si eso fracasa, se le puede entrenar 
para dar una respuesta distinta (oprimir una palanca en su caja) en caso de que so- 
brevenga la descarga y el sujeto tenga que acabar con ella (Mowrer, 1947). A las 
ratas les resulta difícil aprender esta evitación discriminativa, lo cual concuerda 
con los argumentos de Guthrie, pero el hecho de que aprendan a solucionar el pro- 
blema es contrario a sus opiniones. 

En el aprendizaje de escape y de evitación el sujeto aprende a responder activa- 
mente para impedir o eliminar un estímulo nocivo, En contraste, el castigo se usa 
generalmente para inhibir una conducta que es poderosa porque es o ha sido re- 
compensada. Podemos emplear el castigo para evitar que el niño haga algo que le 
gusta, para romper un “mal hábito”. Según Guthrie, este tipo de castigo opera 
sólo si crea una clase de competencia o de conflicto entre la respuesta de acerca- 
miento a la recompensa y la reacción de huida al castigo. 

Sheffield resume la posición de Guthrie en lo que respecta al castigo: 


y El castigo funciona únicamente si la última respuesta a la situación castigada es in- 
compatible con la respuesta que provocó el castigo. 

b) El castigo opera sólo si los indicios presentes cuando se ejecuta la respuesta incom- 
patible persisten cuando la respuesta castigada se realiza. 

c) El castigo que solamente produce excitación emocional tenderá a fijar la respuesta 
castigada (1949). 
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dir estas respuestas competidoras, y de relacionar con ellas los efectos del castigo 
Dunham, 1971, 1972) no apoyan la posición de Guthrie. Pareciera más bien que 
los animales dejan de ejecutar la respuesta castigada porque quieren evitar la esti- 
mulación aversiva que depende de ésta. 


Interpretaciones neoguthrianas de las recompensas 
y Jas intenciones 


Entre los numerosos psicólogos experimentales contemporáneos influidos por 
Guthrie, F. D, Shefbeld no sólo es uno de los defensores más convincentes de la 
teoría sino que también propone ciertas innovaciones. Uno de los cambios sobre- 
salientes reside en la nueva interpretación de la manera en que opera la recom- 
pensa para guiar las respuestas instrumentales, especialmente en las situaciones 
de apetito. La interpretación de Sheffield apareció por primera vez en 1954 en una 
transcripción mimeografiada de una conferencia, y más tarde en una obra publ- 
cada Sheffield, 1965). Consideremos la situación simple en la cual una rata ham- 
brienta, por ejemplo, corre por un laberinto en forma de T para obtener una re- 
compensa alimenticia en una de las cajas situadas en los extremos, o que oprime 
una palanca que le entrega una porción de alimento, La primera idea es que los 
estímulos propioceptivos de la respuesta crítica (presionar la palanca) tienen una 
relación temporal óptima con la respuesta incondicionada (comer), de modo que 
las partes fraccionarias de la respuesta consumatoria se condicionarán a estos i1- 
dicios propioceptivos críticos, así como a aquellos movimientos precursores que 
anteceden a la respuesta crítica (aproximarse a la palanca, erguirse para presia- 
narla, etc.). Se supone, además, que cuando se inician los primeros componentes 
de esta cadena conductual exitosa, producen estímulos que causan la anticipación 
de la actividad consumatoria; esta anticipación genera '“excitación'* que fortalece 
el segmento en curso de la cadena de respuesta exitosa, y la hace competir de 
modo más efectivo con Jos distractores que interfieren. Después de bastantes en- 
sayos de condicionamiento, la rata es atraída para ejecutar la cadena conductual, 
porque cuando selecciona respuestas exitosas éstas producen estímulos que ma- 
ximizan la excitación condicionada de la respuesta consumatoria (anticipación de la 
recompensa). Sheffield utilizó estas ideas para explicar gran parte de la acción de 
las recompensas positivas sobre el aprendizaje. Es significativo que Spence (1956) 
y otros hullianos adoptaron una explicación similar de los efectos de la recompensa 
en su concepto de la motivación de incentivo (que era la variable interviniente a la 
cual afectaba la recompensa en el sistema de Hull; véase el capitulo 5). Las ideas 
de Sheffield tarabién influyeron en Mowrer (1960), en las explicaciones posterio- 
res de sus teorías acerca de los efectos de la recompensa. 

W. K. Estes, otro innovador en la tradición guthriana, ha adoptado casi la mis- 
ma hipótesis acerca de la forma en que las recompensas influyen en la respuesta 
instrumental: 


Se supone que...la evocación de la respuesta depende de la acción conjunta de la en- 
trada de estímulos de los receptozes y la entrada de los mecanismos de impulso (motiva- 
cionales). .. Originalmente estos mecanismos específicos son activados por estímulos 
incondicionados; por ejemplo, el mecanismo asociado con el hambre se activa con el sabor 
de la comida; el mecanismo asociado con el dolor lo es por el impacto de la estimulación 
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traumática. El resultado de la actividad de un mecanismo de impuso es generar lo que po- 
dría denominarse retroalimentación facilitadora o inhíbidora. .. .Mediante en el aprendi- 
zaje por asociación... el control de estos mecanismos de impulso positivos y negativos se 
extiende a los estímulos que han antecedido a los estímulos incondicionados arisinales. .. .El 
resultado de esta combinación de mecanismos motivacionales y asoctativos es que después 
de alguna experiencia de aprendizaje la conducta del organismo es continuamente modulada 
por las anticipaciones de las recompensas o los castigos, las secuencias conductuales que 
conducen a incrementos en la retroalimentación positiva se seleccionan preferencialmente, 
y las secuencias conductuales que conducen a decrementos en la retroalimentación positiva 
o al castigo se inhiben (1970, págs. 10-11). 


Si en la declaración de Estes se sustituye “facilitar la retroalimentación de im- 
pulso” por *““impulso mediante la excitación condicionada de la respuesta consu- 
matoria'*, se destaca la similitud de las dos formulaciones. La nueva adición de Es- 
tes es la noción de inhibición recíproca entre los centros generales de impulso 
*“*positivos'' y ““negativos”*. De este modo, si mientras el animal ejecuta una se- 
cuencia de respuesta de apetito ve o escucha una señal asociada con la ansiedad, 
ésta activará el mecanismo de impulso negativo o inhibidor, inhibirá recí- 
procamente el mecanismo de impulso positivo, y asf disminuirá la ejecución de 
cualquier respuesta de apetito en tanto esté presente la señal de ansiedad. Estes 
y Skinner (1941) ya habían observado este tipo de efecto, que se conoce como stt- 
presión condicionada, y que se ha estudiado mucho. La premisa de Estes de la in- 
hibición recíproca entre los motivos positivo y negativo parece razonable y quizá nos 
permita interpretar un cierto número de resuttados distintos del castigo (véase Es- 
tes, 1969b). 


El control del proceso de aprendizaje 


Parte del encanto de las obras de Guthrie se debe a que están en estrecho con- 
tacto con la vida cotkdiama y proporcionan sugerencias divertidas, pero convincentes, 
para resolver los problemas del entrenamiento animal, la crianza de los niños y la 
pedagogía. Este carácter práctico no es una característica necesaria del sistema, ya 
que si intentáramos seriamente proporcionar evidencia para la teoría, quedaríamos 
aprisionados entre las correlaciones del movimiento exacto de los estímulos men- 
surables y la tensión muscular que acompaña a los ajustes preparatorios. Pero no 
se trataba de tomar en serio al sistema en ese sentido. Siempre que se encontraba 
una forma conveniente de hablar acerca de determinados aspectos sin que esto en 
apariencia contradijera al sistema, se presumía que la exactitud cuantitativa no era 
esencial. Guthrie estaba convencido de que las leyes científicas, para que resulten 
útiles, debe ser aproximadamente verdaderas, pero también han de estar enuncia» 
das en un lenguaje lo bastante llano como para que lo comprenda un alumno de pri- 
mer año (1936). 

La mayor parte de los consejos prácticos de Guthrie eran efectivos, y logró que 
brotaran de la teoría. Considérese lo siguiente: 


La madre de una niña de 10 arios se quejó con un psicólogo de que durante dos años su 
hija la había molestado con el hábito de tirar el sombrero y el abrigo al piso, al entrar en la 
casa. En infinidad de ocasiones la madre insistió en decirle a la niña que recogiera las pren- 
das y las colocara en su lugar. Este hábito desordenado sólo pudo cambiarse cuando la 
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madre, según el consejo del psicólogo, comenzó a instar a la niña no a que recogiera las 
prendas del suela sino a que se las pusiera, volviera a salir, entrara de nuevo a la casa y en 
esta ocasión se quitara el abrigo y lo colgara en su lugar (1935, pág. 21). 


¿Por qué se dio este consejo? La conducta se emite en respuesta a los estímu- 
los. El hecho de colgar el sombrero y el abrigo era una respuesta que la niña daba 
al ruego de su madre cuando ésta veía las prendas en el suelo. Para que la conduc- 
ta deseada quedara vinculada a sus indicios apropiados, era necesario que la niña 
saliera a la calle y entrara en la casa, de modo que hacerlo se convirtiera en el indi- 
cio para colgar el abrigo y el sombrero, 

Veamos algunas sugerencias que representan temas recurrentes en las obras 
de Guthrie: 

1. Si usted desea alentar un tipo particular de conducta o desanimar otro, descu- 
bra los indicios que conducen a la conducta en cuestión. En un caso, disponga la si- 
tuación de tal modo que la conducta deseada ocurra cuandos esos indicios estén 
presentes; en otro arréglela de manera que la conducta indeseada no se produzca 
en presencia de los indicios. Esto es todo lo que interviene en el uso hábil de la re- 
compensa y el castigo, Los estudiantes no aprenden lo que contiene una conferen- 
cia o un libro: solamente logran aprender lo que la conferencia o el libro los impulsa 
a hacer, 

2, Utilice tantos apoyos de estímulo para la conducta deseada como sea posi- 
ble, ya que cualquier conducta ordinaria es un complejo de movimientos para un 
complejo de estímulos. Cuanto más estímulos haya en asociación com la conducta 
deseada, menos probabilidades habrá de que los estímulos de distracción y la con- 
ducta competidora desequilibren la conducta deseada. Los actores de teatro af- 
cionados se confundirían menos en sus líneas si realizaran más ensayos generales, 
ya que los indicios del escenario y los actores son parte de la situación a la cual res- 
ponden, Dicho de otro modo, deberíamos practicar de la forma exacta que más 
tarde se nos exigirá. 

3. Para formar un hábito intencional, oblíguese a dar siempre la respuesta y a no 
permitir un descuido. Entonces se torna tan automática que se producirá sin es- 
fuerzo. Por ejemplo, el consejo opera para enseñarse a uno mismo a colocarse el 
cinturón de seguridad en un automóvil, o a detenerse por completo en las señales 
de alto, etcétera. Así, no deben tolerarse excusas o interferencias en relación con 
la rutina deseada. 


Respuestas estereotipadas en el aprendizaje 


Guthrie realizó relativamente muy pocos experimentos para comprobar sus 
ideas, pero en uno que llevó a cabo con Horton (1946) investigó la estereotipia 
(igualdad”” durante los ensayos) de la respuesta aprendida de un animal. Guthrie 
y Horton estudiaron gatos que escapaban de una caja-problema y recibían atún 
como recompensa; la puerta se abría cuando el gato se frotaba contra un poste en 
el centro de la caja. El mecanismo de liberación también hacía que una cámara to- 
mara una fotografía del animal en el momento en que tenía un contacto exitoso con 
el poste. A] animal se le acostumbró primero a la caja problema, se le enseñó a s5a- 
lis por la puerta para conseguir el alimento, y entonces la puerta se cerraba y se 
ponían en funcionamiento el poste y la cámara. Al observar las fotografías de un 
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felino que ejecutaba la respuesta correcta durante sucesivos ensayos de aprendi- 
zaje, Guthrie y Horton concluyeron que la estereotipia de respuestas era la regla: 
un gato que frotaba su flanco izquierdo contra el poste podía hacerlo repetidas 
veces; otro tocaría el poste con su cabeza en la misma posición también una y Otra 
vez. Las fotografías eran muy convincentes. En concordancia con la teoría de 
Guthrie del aprendizaje de movimientos específicos, en un ensayo un gato parecía 
aprender algún método pecubiar de escape en el primero de ellos y entonces lo re- 
petían de forma similar ensayo tras ensayo. 

Los críticos plantearon varias objeciones al experimento y a la interpretación de 
Guthrie y de Horton. Intentaron remarcar la variabilidad sustancial en el compor- 
tamiento de un gato de un ensayo a otro, y explicar la estereotipia en otros térmi- 
nos. Por ejemplo, si el comportamiento que tiene éxito es simple y fácil de aprender, 
cualquier teoría espera la estereotipia de esa respuesta prepotente y reforza- 
da. Otra objeción importante es que la naturaleza física de la respuesta exitosa 
impone ciertas restricciones o limitaciones sobre los tipos de cosas que el gato 
podría hacer para mover el poste. El punto básico puede obtenerse al establecer 
una analogía exagerada, 

El efecto de esta restricción al tomar fotografías se ve con más claridad en un 
experimento donde el animal tiene que erguirse sobre sus patas traseras y alcan- 
zar la esquina superior de la jaula para oprimir un botón que abre la puerta y accio- 
na la cámara. De esta manera, restringimos aún más el conjunto de posibles res- 
puestas y logramos una estereotipia extra. Por otro lado, pueden construirse 
otras situaciones experimentales que reducen la estereotipía. Sin embargo, en 
cualquier caso lo gue se busca son datos acerca de las respuestas definidas en tér- 
minos de efecto (Mueller y Schoenfeld, 1954, pág. 358). 

La objeción más seria a los experimentos de Guthrie y Horton es que af parecer 
elos no observaban aprendizajes de respuesta de ningún tipo, sino que el compor- 
tamiento que mostraban los gatos de ““frotarse contra el poste”' tal vez fuera una 
forma específica de la especie de comportamiento de ““safutación”? de práctica- 
sente todos los miembros de la familia Felidae (incluyendo leones, tigres, jagua- 
res, ocelotes y gatos domésticos). Este tipo de frotemiento del flanco o de la 
cabeza ocurre de modo espontáneo cuando el gato ve un objeto amado o una per- 
sona amigable, si el objeto amado está demasiado lejos, el frotamiento puede di- 
rigise a la reja más cercana, a un mueble, o al “poste de escape” de Guthrie y 
Horton. Noore y Stuttard (1979) dirigieron una réplica parcial de dicho experi- 
sento con la excepción de que nunca alimentaban a sus gatos cerca de la caja-pro- 
blema ni los dejaban escapar cuando se restregaban contra el poste. Sia embargo, 
Moore y Stuttard observaron que los animales se frotaban contra el poste central 
(de modo estereotipado), principalmente si el observador humano era visible a 
través de las ventanas de vidrio; pero casi nunca lo hacían cuando no veían a un ser 
humano o a otro objeto querido. Como Guthrie y Horton siempre estaban a la vis- 
ta de sus gatos, parece probable que sólo estuvieran provocando en sus animales 
reacciones de salutación específicas de la especie. Por lo tanto, existe la posibili- 
dad de que en sus experimentos no hubiese un ''moldearmiento de la respuesta 
por reforzamiento”. 

Así, la situación de aprendizaje elegida tiene mucho que ver con qué aspectos 
de h conducta serán revelados. La caja-problema de Guthrie y Horton, que en un 
comienzo parecía revelar la naturaleza primitiva del aprendizaje, puede ser en ver- 
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dad una situación muy especializada, mal diseñada para demostrar el comporta- 
miento de un gato conforme pasa por el aprendizaje. 


Otras pruebas y derivaciones 


La teoría de Guthrie no ha provocado demasiadas pruebas críticas, ni positivas 
ni negativas, quizá debido a su *astuto'” atractivo en lo que se refiere a los movi- 
mientos y los éstímulos no observables. Alrededor de la idea del aprendizaje de 
respuesta de Guthrie se han realizado algunos experimentos críticos. Los reseña- 
dos por Lashley (1924) dernostraban que los animales tendían a aprender una gran 
clase de equivalencia de respuestas que alcanzan cierto resultado final, más que 
aprender un rígido movimiento especifico. Á una rata a la que se le ha enseñado a 
correr a lo largo de un laberinto para conseguir comida, en condiciones alteradas 
de prueba nadará a través de] mismo laberinto cuando esté inundado, o se moverá 
bamboleándose sobre el piso (si una lesión en el oído interno ha desequilibrado su 
coordinación para correr), y lo hará de una forma infalible hasta llegar a la caja 
objetivo. O una persona que ha sido condicionada para extender su dedo índice ante 
un EC a fin de evitar una descarga en la yema del dedo, lo fexsorará si su mano 
está volteada: ha aprendido a *“alejarse de” la descarga, no a flexionar o a exten- 
der sus dedos (Wickens, 1938). Tales experimentos constituyen testimorias con- 
tra la adopción inmediata de las afirmaciones de Guthrie de que los hábitos de mo- 
vimiento muscular de indicio específico son la base de toda la conducta aprendida, 
Más bien parecería, que cualquier respuesta disponible se utiliza cuando se nece- 
sita para lograr un cierto resultado final, como ilegar a la caja con alimento o evitar 
la descarga eléctrica. 

Voeks (1948, 1950) realizó un notable esfuerzo para encontrar evidencia que 
apoyara la teoría de Guthrie. Examinó la repetición de la respuesta en el aprendi- 
zaje de los seres humanos en un laberinto de tablero perforado de multiunidad. Se- 
gún la regla del condicionamiento de la última respuesta, de Guthrie, la investiga- 
dora descubrió que el mejor predictor de la respuesta que emitiría un sujeto en un 
punto elegido del laberinto era la respuesta más reciente que había dado allí en los 
ensayos anteriores, zo la respuesta más frecuente durante toda la serie pasada de 
ensayos. Sin embargo, en un trabajo más extenso sobre el aprendizaje de selec- 
ción. Noble (reseñado en Noble, 1966) encontró que el mejor predictor de las res- 
puestas individuales en cada punto de elección era el que se basaba en los reforza- 
mientos pasados. Es decir, la respuesta más probable era la que se había 
reforzado con mayor frecuencia en ese punto de elección durante los ensayos pre- 
vias. El reforzamiento constituía un mejor predictor de la selección de la respues- 
ta, que la frecuencia y la recencia. 

En un trabajo posterior, Voeks (1954) estudió el condicionamiento clásico del 
parpadeo de los ojos de los seres humanos en condiciones de estímulo rígidamente 
controladas. Descubrió que en esa situación la mayoría de Jos sujetos muestran un 
aprendizaje del tipo de todo o nada, que saltan desde cero RC hasta un alto por- 
centaje de RC en un ensayo después de que comenzara el entrenamiento. La in- 
vestigadora llegó a esta conclusión al examinar los ensayos después de la primera 
RC del sujeto, y al observar que ningún sujeto incrementaba su probabilidad de RO 
durante estos ensayos. La mitad de sus sujetos emitieron RC en todos los ensa- 
yos después del primero, y los demás sólo mostraron unos cuantos errores. 
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¿Cómo se comparan los resultados de Voeks con las numerosas curvas de ad- 
quisición publicadas paras las RC? Se sabe que las curvas para grupos de sujetos 
muestran características muy distintas que las de sujetos individuales. Voeks de- 
muestra de modo muy convincente, tal como Guthrie había argumentado, que la 
adquisición de la respuesta puede ocurrir de una forma de todo o nada en un ensa- 
yo para cada individuo y, sin embargo, la curva de aprendizaje promedio del grupo 
mostrará una inclinación gradual, La curva del aprendizaje acompañante (figura 
4.2) resulta por ejemplo, cuando la probabilidad de la respuesta se traza como una 
función de grupo para quince sujetos, todos los cuales tienen curvas en forma de 
salto; es decir, todos responden consistentemente con las RC después de dar la 
primera. La forma de la curva está determinada solamente por el ensayo en el cual 
aparece la primera RC con diferentes sujetos. Hechos reveladores como éstos 
fueron los que motivaron el moderno desarrollo de los madelos del aprendizaje de 
todo o nada en la teoría del muestreo de estímulo (véase el capítulo 8). 

Voeks pronosticó curvas de aprendizaje en forma de salto en las condiciones 
muy uniformes de estimulación que dispuso, y sus pronósticos se confirmaron. Sin 
embargo, no todas las curvas de condicionamiento individual son de este tipo. Por 
ejemplo, Hilgard (1931) y Cohen, e Hilgard y Wendt (1933) ya habían publicado 
curvas de condicionamiento de los párpados de sujetos individuales que mostraban 
un condicionamiento gradual, ¿Á qué se debe la diferencia? Quizá el mayor grado 
de control sobre los estímulos extraños en la situación extrema que dispuso 
Voeks, ya que se sabe que el condicionamiento se produce con más rapidez cuan- 
do hay menos variabilidad de distracción en las condiciones que rodean a la pre- 
sentación del EC. Asimismo, Yoeks usó un chorro de aire muy fuerte dirigido al 
ojo como un El, y es probable que muchos de sus sujetos aprendieran lo que hoy 
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Figura 4.2. Efecto engañoso que se obtiene al cambiar las curvas del aprendizaje in- 
dividual. La curva de grupo resulta de una combinación de las curvas de quince suje- 
tos, todos los cuales tenian curvas en forma de salto, es decir, un segmento de nu res- 
puesta seguido por respuestas consistentes (tomada de Voeks, 1954] 
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en día clasificaríamos como una respuesta de “'evitación voluntaria”, en vez de 
una verdadera respuesta condicionada. 

Además, para reducir lá variabilidad de la kinestesia muscular en el momento de 
la presentación del EC, Voeks hacía que sus sujetos mordieran una tablilla y apre- 
taran un dinamómetro manual; pero desde entonces se ha descubierto que tales 
tonos musculares generales acrecentados sensibilizan muchos reflejos, en parti- 
cular aquellos como el parpadeo del ojo. Por último, Spence (1956) demostró que 
tales curvas de condicionamiento del tipo de salto estarían implícitas en una teoría 
(corw la de Hull) que presuponga la acumulación gradual de la fuerza de asocia- 
ción, un grado bajo de variabilidad fluctuante en la fuerza de momento a momento. 
y la premisa de que las RC ocurren sólo cuando la fuerza momentánea del hábito 
E-R sobrepasa algún umbral para la evocación de la respuesta. Consideraciones 
como ésta apoyan las interpretaciones alternativas de los datos de Voeks. 

F. D. Sheffield (1961), un discípulo de Guthrie, amplió las ideas de éste al desa- 
rrollar una teoría para explicar el aprendizaje de las tareas secuenciales complejas 
a partir de demostraciones y de la práctica. Para Sheffield era central el concepto 
de las respuestas sensoriales (“imágenes”), que supuestamente son primordiales 
y no necesitan tener componentes motores. Las respuestas sensoriales son los 
representantes internos de los patrones de estímulos externos: 


Se supone que tales respuestas sensoriales están sometidas a los principios del apren- 
dizaje de asociación por contigilidad, y que tienen propiedades de indicio así como propie- 
dades de respuesta. Es decir, una respuesta sensorial no sólo puede estar conectada con 
un indicio, sino que también es un indicio con el cual pueden conectarse otras respuestas 
(1961, pág. 14). 

La posición que adoptamos es que lo que suele denominarse ''percepción'' se refiere a 
los casos en los cuales la estimulación sensorial inmediata no sólo provoca sus respuestas 
sensoriales innatas, sino también Otras que han sido condicionadas a la estimulación inme- 
diata en la experiencia pasada (1961, pág. 15). 


Sheffield utiliza las respuestas sensoriales postuladas para discutir el aprendizaje 
del estudiante acerca de lo que parecen las cosas (por ejemplo, el interior de un 
carburador), y para representar la secuencia de eventos y acciones que aquél 
aprende a medida que desarma un carburador y trata de localizar sus fallas. She- 
field se refiere al “condicionamiento eruzado”” de una respuesta sensoríal con 
otras, para representar secuencias de eventos esperados en las etapas de de- 
sarmar una máquina o volver a armarla. Estas secuencias de respuesta sensorial, 
aprendidas tal vez al observar una película o una demostración, sirven de guía para 
las conductas posteriores. 

Aunque la noción de condicionamiento de las respuestas sensoriales en patrones y 
secuencias era muy novedosa en la tradición de estímulo y respuesta, en muchos 
aspectos parece ser casi lo mismo que durante muchos años han estado señalando 
los psicólogos mentalistas o cognoscitivistas. ¿Obtenemos más 'objetividad” al 
hablar acerca de las respuestas sensoriales que al hacerlo sobre las imágenes o las 
ideas? ¿Qué se gana al discutir el condicionamiento de un indicio o patrón produci- 
do como respuesta a otra respuesta sensorial si la teoría es sólo la *'asociación de 
ideas”* en un arreglo £-R? Una evaluación justa consiste en notar que el artículo 
de Sheffield proporciona uno de los análisis más detallados de las habilidades per- 
cepto- motoras: de la adquisición de las mismas, su representación interna y su 
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uso; y el análisis es valioso cualesquiera que sean nuestras predilecciones por un 
vocabulario teórico. 

En su artículo final, Guthrie (1959) repitió los argumentos de su sistema pero 
agregó un cambio importante: recalcó el papel de la atención para seleccionar los 
estímulos que serían condicionados y los que controlarían la respuesta. Su nueva 
regla se estipula sucintamente así: '"Lo que llega a notarse se convierte en la señal 
para lo que se hace”” (Guthrie, 1959, pág. 186). Esto transforma al control de la 
atención en un componente importante en la explicación de la conducta. Guthrie 
también observó que cuando se presentan dos indicios que provocan respuestas 
incompatibles, el sujeto se dedica a conductas muy cuidadosas, y explora los indi- 
cios en busca de una señal para decidir qué respuesta ejecutar. Esto es similar a la 
idea de Tolman de la conducta vicaria de ensayo y error (VEE) de los animales en 
conflicto (véase el capítulo 11), y se adelanta al modelo de exploración de la con- 
ducta elegida que proponía Estes (véase el capítulo 8). Guthrie no presentó nueva 
evidencia en apoyo de su teoría del aprendizaje, sino que continuó sosteniendo que 
dentro de su sistema podían interpretarse otros resultados. 


EVALUACIÓN DE LA POSICIÓN DE GUTHRIE 


El enfoque guthriano de los problemas 
típicos del aprendizaje 


A manera de sumario, presentaremos a grandes rasgos la posición de Guthrie 
acerca de diversos problemas representativos del aprendizaje. 

1. Capacidad. Los problemas de la capacidad no se tratan de modo formal, aun- 
que se reconocen las diferencias entre las especies y se tiene en cuenta la madu- 
ración como una determinante de muchos tipos de actos (1935, págs, 18, 38). Es 
de suponer que cualquier respuesta que el organismo dé puede asociarse con cual- 
quier estímulo al que sea sensible; esta generalización acerca de la posibilidad del 
aprendizaje nos recuerda lo que Thorndike decía sobre el cambio por asociación. A 
la luz de la evidencia revisada en el capítulo 3, la presuposición de la asociabilidad 
equivalente ahora parece falsa. Si se le presionara, Guthrie podría encontrar una 
base para las diferencias en capacidad, tanto en la diferenciación del movimiento 
como en la discriminación entre indicios propioceptivos. No todos los animales tie- 
nen la misma versatilidad ni están equipados igualmente con receptores. 

2. Préctica, La práctica asimila o aparta indicios de movimientos específicos has- 
ta que aparezca una familia completa de combinaciones de estímulo para evocar 
una gama entera de respuestas, lo cual conduce al resultado que socialmente se 
describe como ejecución exitosa. Como la habilidad representa una población de 
hábitos, el aprendizaje parece acumularse con la repetición, aunque en lo básico 
cada hábito o unidad atómica individual se aprende con toda su fuerza en una sola 
repetición. 

3. Motivación. La motivación afecta indirectamente al aprendizaje a través de lo 
que induce a hacer al animal. La recompensa es un principio secundario o deri- 
vado, no primario como en el sistema de Thorndike. La recompensa opera porque 
saca al animal de la situación estimulante en la cual se había dado la respuesta ““co- 
rrecta””. No la fortalece, sino que impide su debilitamiento debido a que ninguna 
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respuesta nueva puede vincularse con los indicios que conducen a la correcta. Por 
lo tanto, hay un fortalecimiento relativo, ya que se apartan las respuestas a otros 
indicios. ustramos algunas de las dificultades que implica esta idea, y demostra- 
mos la manera en que los neoguthrianos Sheffield y Estes enfocan ahora los efec- 
tos de la recompensa. 

El castigo produce varias cosas distintas al mismo tiempo. En general, sus efec- 
tos para el aprendizaje se determina por lo que induce a hacer al organismo, de 
acuerdo con el principio de que el mejor predictor del aprendizaje es la respuesta 
enla situación que ocurrió al final. Pueden distinguirse cuatro casos: 


a) El castigo ligero puede ser meramente excitante, y acrecentar la conducta en marcha 
en vez de interrumpirla. 

d) El castigo más intenso puede romper un hábito al conducir a conductas incompatibles 
en presencia de los indicios. 

c) Un estímulo aversivo continuo actúa como un impulso, que produce estímulos de man- 
tenimiento que conservan activo al organismo hasta que encuentra alivio. Entonces, la 
consecuencia para el aprendizaje es en realidad como la de la recompensa: el acto que 
conduce a la seguridad es recompensante porque termina con el castigo y, al eliminar 
los estímulos de mantenimiento, sirve de protección para no aprender las actividades 
ejecutadas en presencia de esos estímulos. 

d) Los estímulos que han acompañado previamente al castigo producen conductas que 
antes ocurrían después del castigo mismo. Aquí tenemos un ejemplo de la respuesta 
anticipatoria, esencial para la conducta de evitación. Para que tal anticipación ocurra, 
los indicios de evitación deben haber sido presentados anteriormente, en el momento 
de) castigo. Un problema inherente a esta opinión consiste en explicar cómo los orga- 
nismos aprenden respuestas de evitación que difieran de la respuesta de escape dada 
al estímulo nocivo. 


4. Comprensión. Los conceptos como el de *“discernimiento'* se manejan irómi- 
camente, aunque se reconoce que puede ocurrir el aprendizaje con previsión de 
sus consecuencias. Sin embargo, la tendencia de Guthrie es menospreciar tal 
aprendizaje. como lo hacía Thorndike, y recalcar la naturaleza mecánica y tepeti- 
tiva de gran parte del aprendizaje humano, así como del animal, El aprendizaje con 
intención y previsión como ocurre en verdad se explica con base en las reacciones 
condicionadas de anticipación o de preparación, fundamentadas en la experiencia 
pasada y que, por lo tanto, no contradicen a los principios de la asociación. 

5. Transferencia. El aprendizaje se transfiere a situaciones nuevas debido a los 
elementos comunes entre la nueva y la antigua. Esta posición es muy parecida a la 
de Thorndike. Sin embargo, se pone de relieve el hecho de que la identidad se 
transmite mediante las respuestas comunes evocadas, y los estímulos propiocep- 
tivos son lo suficientemente similares, en el caso de las respuestas a una variedad 
de estímulos, como para evocar respuestas condicionadas comunes. Así, el énfa- 
sis sobre los estímulos provocados por el movimiento representa una contribución 
que Guthrie hace al pensamiento de Thorndike. 

Debido a su principio de que las respuestas son condicionadas a todos los estí- 
mulos contiguos adventicios, Guthrie esperaba muy poca transferencia y, de he- 
cho, tenía una posición muy extrema alrededor de este punto. La única manera de 
estar seguro de conseguir la conducta deseada en una situación nueva consiste en 
practicar también en ella: para ser capaces de desempeñamos en una variedad de 
situaciones, debernos practicar en una variedad de situaciones, 
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6. Olvido. Se dice que el aprendizaje es permanente a no ser que interfiera un 
nuevo aprendizaje. Es asi que todo olvido se debe al aprendizaje de respuestas 
nuevas que reemplazan a las antiguas. Es posible que ocurra gradualmente por la 
misma razón que las habilidades se adquieren poco a poco: el recordar depende de 
smuchos hábitos para muchos indicios, y los subhábitos pueden desaparecer de ma- 
nera gradua) a medida que los subindicios se vinculan con las respuestas nuevas. 

En contraste con Thorndike, Guthrie era un conductista reconocido que consi- 
deraba importante deshacerse de términos subjetivos, para referirse, por ejem- 
plo, al lenguaje interno en lugar del pensanuento. El acento sobre los estímulos 
producidos por el movimiento era parte de la antigua tradición conductista de 
Watson. que Guthrie continuó, Aunque conductista ortodoxo en estos aspectos, 
lo era de snodo informal y con muy poco de la inseguridad de los primeros watso- 
nianos. 


Invulnerabilidad de la teoría: un motivo para el 
esrepticismo 


La inseguridad que existe en casi toda la experimentación del aprendizaje provo- 
ca que un psicólogo realista se muestre suspicaz respecto de un sistema termi- 
nado en esta etapa de nuestros conocimientos. Aunque la verdad científica deba 
tener finalmente una validez excepcional si sus leyes son en verdad válidas, la his- 
toria de nuestras ciencias más avanzadas demuestra que sus teorías se mueven 
por aproximaciones sucesivas, y que las teorías más audaces no emergen ya tor- 
madas de la mente del científico, Hasta un sistema tan indeterminado como el de 
Thomdike pasó por revisiones con base en la evidencia acerca de los efectos del 
castigo y, como veremos en el capítulo 5, el sistema de Hull se revisaba continua- 
mente para ajustarlo a los datos experimentales. Una de las fuentes de inquietud 
acerca del sistema de Guthrie reside en sus confiadas respuestas a los problemas 
del aprendizaje: respuestas que permanecieron inalterables a lo largo de más de 
cuarenta años de activa experimentación psicológica. Las controversias experi- 
mentales finalmente se resolvieron cuando aprendimos más acerca de las variables 
independientes que modifican a las consecuencias medidas. No importa cómo se 
resuelvan estos temas: el sistema de Guthrie permanece inalterable. O la teoría 
está milagrosamente inspirada o no se ha establecido con mucha precisión y, por 
lo tanto, no es muy sensible a los datos experimentales. 


La sencillez de la teoría puede ser ilusoria 


Sin lugar a dudas, gran parte de la fascinación que ejerce la teoría de Guthrie de- 
pende de su aparente capacidad de explicar una amplia gama de fenómenos a partir 
del simple principio de la asociación contigua en un solo ensayo. Las teorías cientí- 
ficas parsimoniosas son atractivas. Una laboriosa búsqueda en las obras de Guth- 
rie de una definición cuidadosa de estímulo y respuesta, de las distinciones emre 
los elementos observables y las construcciones hipotéticas, de las declaraciones 
que adoptan la forma de predicciones y de las que asumen ja de explicaciones a 
posteriori, lleva a los críticos a esta conclusión: 
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Aunque los principios del condicionamiento que Guthrie amplía parecen tener una parsi- 
monia que sería deseable en una formulación teórica de la conducta, un análisis más pro- 
fundo revela que se requiere de un formidable conjunto de premisas y construcciones hi- 
potéticas adicionadas para que esta teoría posea alguna aplicabilidad real a los datos ex- 
perimentales (Mueiler y Schoenfeld, 1954, pág. 377). 

Indudablemente, muchas reseñas del pensamiento de Guthrie confunden su sencillez 
con algo inacabado. (Mueller y Schoenteld, 1954, pág. 368). 


Guthrie era incomparable en el uso de la anécdota y de la Justración para reali- 
zar pertinentes comentarios en torno a las actividades de la vida cotidiana, inclu- 
yendo los síntomas que se encuentran en la cínica psicológica. Este complicado ma- 
teria) se presenta en términos curiosamente sencillos, y su teoría facilita el empleo 
de este tipo de lenguaje. Hay mucho qué aprender en la psicología de Guthrie, la 
cual tiene el suficiente atractivo como para haber llevado a varios jóvenes prome- 
tedores de ambos sexos a emprender productivas carreras en el campo de la psico- 
logía, lo que constituye una contribución que no debe pasarse por alto. 

En el nivel experimental, el mayor aporte de Guthrie fue dirigir la atención 
hacia los grandes elementos de la repetición y la estereotipia en la conducta cuan- 
do las oportunidades son favorables. Pero Guthrie era un asociacionista de corazón, 
con una fuerte tendencia conductista, Aunque sin duda la tradición asociacionista 
habrá de continuar, el conjunto particular de capitulaciones conductistas que etec- 
tuara Guthrie parece haber perdido su atractivo para las generaciones posteriores, 


LECTURAS COMPLEMENTARIAS 


En los siguientes libros se expone la teoría de Guthrie: 


Guthrie, E. R., The psychology of learning, 1935 y 1952. 
Guthrie, E. R., The psychology of human conflict, 1938. 


En los siguientes artículos son resúmenes de la teoría de Guthrie, en los cuales se mues- 
tra lo poco que ha variado la teoría a través de los años: 


Guthrie, E. R., '*Canditioning as a principle of learning””, en Psychological Review, 37, 1930, 
págs. 412-28. 

Guthrie, E. R., “Conditioning: A theory of learning in terms of stimulus, response and 
association”*, capítulo 1 en The psychology of learning. National Society for the Study of 
Education, 4ist Yearbook, parte TI, 1942, págs. 17-60. 

Guthrie, E. R., “Assaciation by contig úty'', en S. Koch (dir.), Psychology: A study of a 
science, 1, 1959, págs. 158-95. 


Para una revisión crítica de la contribución de Guthrie, desde el punto de vista de la lógica 
de la ciencia y de la formación del sistema, véase: 


Mueller, €. G. Jr. y Schoenfeld, W. N., “Edwin R. Guthrie”, en W.K. Estes et al.; 
Modera learning theory, 1954, págs. 345-79. 
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La teoría sistemática 
de la 


conducta, de Hull 


Clark L. Hull (1884-1952), muy impresionado por la obra de Pavlov Condifioned 
Reflexes aparecida en 1927, publicá subsecuentemente una extensa serie de ar- 
tículos teóricos y libros que en su totalidad constituyen el mejor ejemplo de la teori- 
zación sistemática en psicología durante la primera mitad del siglo XX. La teoría de 
Hull es reconocidamente conductista y mecanicista, y de modo intencional evita 
toda referencia a la conciencia. Su concepto central es el hábito, e infiere gran par- 
te de su información acerca de él a partir de experimentos con respuestas condicio- 
nadas, efectuados principalmente con animales. Se asume además que la conducta 
compleja es derivable de lo que se conoce acerca de las formas más elementales 
del aprendizaje. Hull utilizó como punto de partida los resultados de los experi- 
mentos de condicionaniento, adoptó la ley del efecto, de Thorndike, e intentó ex- 
plicar propósitos, discernimientos y otros fenómenos que al corductismo inicial le 
resultaba difícil abarcar. 


LA ORIENTACIÓN BÁSICA 


Hull era un conductista y buscaba una teoría que explicaba cómo y por qué los 
organismos emitían sus respuestas peculiares. El ambiente común de estimula- 
ción sólo es pacientemente responsable de la conducta seleccionada; deben reco- 
nocerse otras influencias como el historial de entrenamiento previo del organismo 
en ésta o en situaciones semejantes, estados de necesidad biológica creados por la 
privación de alimento, agua y elementos similares; el estado de salud o de cansan- 
cio del organismo, la administración de drogas, etcétera. Hull aceptaba que la 
influencia de estas variables históricas y/o de privación sobre una gama de conduc- 
tas podrían resumirse mediante una u otra variable interviniente, o construcciones 
teóricas como fuerza del hábito o nivel del impulso. Desde luego, no podemos ob- 
servar a los impulsos ni a los hábitos; éstos constituyen conceptos que se infieren 
de un historial de entradas o de un conjunto de respuestas. 
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Figura 5.1. Hustración de una variable interviniente que media el efecto de las varia- 
bles de entrada / sobre las variables de salida R. 


En la vida diaria utilizamos de manera significativa términos como hábito, sed o 
fatiga, pero el científico debe prestar suma atención a la lógica que sustenta el uso 
de tales términos en una teoría. El ¿impulso de sed es un ejemplo de variable inter- 
viniente: conocemos varios recursos que provocan que un animal sienta sed (darle 
comida salada, privarlo de agua); y conocemos ciertas cosas que estará propenso 
ahacer, como trabajar arduamente para conseguir agua, beber abundante líquido, 
etcétera. En términos abstractos, si hubiera variables de entrada J que causan 
sed, y respuestas de salida R que son el índice de la sed, en principio habrán / x R 
relaciones empíricas que determinar (véase la figura 5.1). Si, por otra parte, pos- 
tulamos la sed como una variable interviniente, y ésta resulta ser unitaria (es de- 
cir, produce los mismos tipos y niveles de conducta sin importar cómo se provo- 
que la sed), entonces el número de relaciones que determinar se reduce af + R; 
la / significa relaciones entre las entradas y la sed, y la R relaciones de la sed a las 
salidas. Cuando Y x R es mayor que f + R, se logra una econonúa al postular va- 
riables intervinientes. 

Como generalmente un estado psicológico dado tiene múltiples causas y efec- 
tos, el psicólogo teórico se ve obligado a postular variables intervinientes para que 
medien entre la causa y el efecto dentro del organismo, Hull era mucho más abier- 
to y explícito que otros teóricos del aprendizaje acerca de la lógica de postulación 
de las variables intervinientes. Pensaba que tales postulados eran legítimos siem- 
pre que el constructo teórica (como la sed) estuviera sujeto a variables o histo- 
riales de entrada manipulables y a conductas mensurables. En su teoría, Hull 
proponía alrededor de ocho variables intervinientes y especificaba sus variables 
causales de entrada; entonces describió cómo se combinaban las diversas varia- 
bles intervinientes para determinar la conducta final observada en el condiciona- 
miento y en situaciones de resolución de problemas. En diferentes ocasiones, Hull 
consideró estas variables intervinientes (como el hábito o la sed) como meras fic- 
ciones convenientes para resumir cálculos en la teoría o, alternativamente, como 
estados y eventos neurales o bioquímicos reales en el sistema nervioso (que es la 
presuposición del lego). Para la mayoría de los propósitos, no hay diferencia si 
adscribimos realidad fisiológica a las variables intervinientes. 
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El sistema de postulados de 1943 


Aunque Hull desarrolló su teoría en el transcurso de varios años, la mejor enun- 
ciación se encuentra en su obra Principles of behavior (1943). Presentó sus postu- 
lados de forma cuantitativa, con una notación matemática adjunta, Aquí los hemos 
simplificado y presentado de otra manera con el objeto de hacerlos más compren- 
sibles; para una exposición completa véanse Hull (1943) o Hilgard y Bower (1966). 

Como hemos dicho, el objetivo fundamental de Hull era descomponer el vínculo 
de estímulo y respuesta de una respuesta aprendida en una serie de variables in- 
tervinientes, que mediaban la influencia causal del estímulo condicionado sobre la 
respuesta ejecutada. En lo que respecta a una respuesta específica, como un par- 
padeo condicionado a un EC, la teoría identifica ciertos factores positivos que llevan 
al sujeto a dar la respuesta (es decir, la fuerza del hábito y el impulso), y ciertos 
factores negativos que alejan de ja respuesta (la fatiga de la respuesta y la inhibición 
condicionada). La diferencia entre estos factores positivos y negativos para una 
respuesta dada determina si se ejecutará y, si es así, a qué velocidad e intensidad. 

En la figura 5.2 se presenta la secuencia de las etapas de cálculo en la teoría de 
Hull. El EC externo pone en marcha una huella de estímulo interno que dura un 
breve lapso; el estímulo excita en la memoria una o más respuestas, cada una de 
las cuales tiene una cierta fuerza de asociación positiva con ese estímulo (el hábito, 
que se simboliza con H), y también una cierta fuerza negativa o inhibidora para ese 
estímulo (inhibición condicionada, o sf). La fuerza positiva neta se obtiene al mul- 
tiplicar la fuerza del hábito por el nivel de impulso actual del organismo (estado mo- 
tivaciona)). El factor negativo total se obtiene al agregar la inhibición temporal de la 
respuesta del organismo (similar a su fatiga o *“cansancio”* y que se designa como 
1) a su inhibición condicionada. Luego se torna la diferencia entre los factores ne- 
tos positivos y negativos. Esta diferencia es la fuerza neta, o potencial de reacción, 
en favor de esa respuesta. Dicho potencial de reacción se compara entonces con 
un umbral de variación aleatoria, y la respuesta ocurre sí el potencial de reacción 
sobrepasa al umbral variable en ese ensayo, Si la respuesta aparece, su velocidad 
e intensidad (o amplitud) son mayores conforme se incrementa su fuerza neta. En 
el caso de que el estímulo excite diversas respuestas, como en una situación de 
discriminación-elección, se supone que el sujeto elige aquella respuesta que es 
momentáneamente más fuerte, 

La fuerza neta de la respuesta, que se simboliza con E, puede representarse 
matemáticamente de la siguiente manera: 


E=(HA xD)—(ÍR + 1R) 


Esta ecuación se aplica a la adquisición inicial, durante la cual el hábito (4) crece 
con ensayos reforzados, mientras los factores inhibitorios permanecen fijos; tam- 
bién se aplicaría a la extinción, durante la cual la inhibición condicionada (s/¿) se 
incrementaría en tanto que ;A,, permanecería fija. Así, la ecuación describe la ad- 
quisición y la extinción de las respuestas condicionadas en el sistema de Hull. El 
lector reconocerá que, en términos abstractos, la teoría en cuestión es muy simi- 
lar a las ideas de Pavlov acerca de la conducta que es determinada por la sustrac- 
ción de la inhibición interna de la excitación, y a las de Guthrie acerca de la res- 
puesta condicionada que compite contra los movimientos de interferencia evo- 
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Figura 5.2. Sumario esquemático de Jas variables intervinientes de Hull y la manera 
en que intervienen para determinar si a un estímulo condicionado se dará una res- 
puesta contliciónada 
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cados por el EC. Asimismo, la determinación de la acción de acuerda con la dife- 
rencia entre los factores positivo y negativo se asemeja a las ideas que sustentan 
los economistas de que las personas eligen aquel curso alternativo de acción que 
maximiza la utilidad neta esperada (es decir, los valores ganados menos aquellos 
perdidos en virtud de una elección dada), La diferencia reside en que Hull intentó 
especificar en detalle la manera en que diversas variables experimentales influyen 
sobre una u otra variable interviniente, y trató de confirmar su hipótesis mediante 
datos experimentales. 


La fuerza del hábito y sus variables causales 


Hull creía en la asociación de los estímulos con las respuestas, y empleaba 
el término fuerza del hábito para designar la fuerza de una asociación dada. En el 
marco de su teoría, el aprendizaje consiste en el crecimiento del hábito durante 
una serte de ensayos reforzados. Hull suponía además que el límite al que crecería 
Ja fuerza de un hábito sería más alto cuanto más favorables fueran el potencial y la 
oportunidad del reforzamiento para esa respuesta. 

Supóngase que M se refiere a la fuerza limitadora de) hábito en circunstancias 
experimentales determinadas. Si A,, designa la fuerza de un hábito a] comienzo 
del ensayo » del experimento, entonces otro ensayo reforzado causa un incremen- 
to ( * £D para H.,, de la siguiente manera: 


AH = 0(M— An) a) 
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Es decir, el cambio en la fuerza del hábito provocado por un ensayo reforzado 
dado es proporcional a la diferencia entre el nivel actual de la fuerza del hábito y el 
límite M, que es la fuerza máxima que puede obtenerse con estas condiciones de 
aprendizaje. $ es una fracción que determina la tasa de crecimiento en el hábito 
por ensayo. Los ensayos de condicionamiento repetidos en las mismas condicio- 
nes de aprendizaje corresponden a aplicaciones reiteradas de la ecuación 1, la cual 
conduce a la siguiente ecuación general, que describe al hábito en cualquier ensa- 
yom; 


Ey = M M-Hp (1 0) (2) 


En esta ecuación se afirma que la fuerza del hábito se incrementa como una fust- 
ción cóncava del número de ensayos reforzados 4, comenzando desde un valor ini- 
cial Ey en el ensayo 1, para acercarse a un límite M, ya que la fracción (1 — 4pA 
disminuye a cero a medida que x se incrementa indefinidamente, 

En sus postulados de 1943, Hul] se apega a una visión de reforzamiento estricto 
del crecimiento del hábito: un ensayo incrementa la fuerza de una respuesta sólo si 
ésta se recompensa. En su opinión, el reforzamiento actúa de la misma forma que 
en el condicionamiento pavloviano y el instrumental; es decir, proporcionando un 
efecto *'satisfactorio”” (o de reducción de necesidad) después de una respuesta. 
En esta perspectiva del condicionamiento pavloviano, el alimento (ED) que sigue a 
la campana (EC) no sólo es un provocador incondicional de la salivación sino tam- 
bién un satistactoy que recompensa cualquier respuesta en marcha, incluyendo la 
salivación causada por la comida. En particular cuando la respuesta de salivación 
ocurre con anticipación, la comida actúa como una fuerte recompensa para la res- 
puesta. Según esta opinión, el aprendizaje en las situaciones de condicionamiento 
pavloviano, así como en las instrumentales, implican un principio de recompensa o 
de satisfacción. La diferencia entre ambos procedimientos es que el pavloviaro 
usa el £J para forzar la ocurrencia de la respuesta correcta (salivación) en conti- 
gúidad apropiada con el EC, mientras que no puede forzarse ningún arreglo sitni- 
lar para las respuestas instrumentales emitidas a capricho del sujeto. 

Hull fue más allá de la ley del efecto y postuló que todos los reforzadores prima- 
rios (''biológicos””) sirven para reducir su impulso (o necesidad) correspondiente 
y, por otra parte, que cualquier reducción del impulso actuaría coma un suceso re- 
forzante. Así, la comida reduce el impulso de hambre, la respiración reduce la ne- 
cesidad de oxígeno que siente la persona que se sofoca, etcétera. La significación 
evolutiva de que los reductores del impulso sean reforzadores, es evidente: los or- 
ganismos que no puedan aprender a reducir sus necesidades biológicas no sobre- 
vivirán el tiempo suficiente para reproducirse. 

En sus últimas obras, Hull modificó ligeramente su posición e identificó el refor- 
zamiento con la seducción de los estímulos de ¿mpulso, que se consideraban más 
como la satisfacción de un ansia que de una necesidad. Existe una sutil distinción 
entre las ansias y las necesidades biológicas. La mayor parte de las necesidades 
conducen a ansias o aapetitos, pero algunas no: por ejemplo, durante la asfixia por 
monóxido de carbono no se experimenta un ansia dolorosa de oxígeno. Y tenemos 
muchas ansias que no se basan en necesidades reales: la persona obesa puede co- 
mer cuando ya está satisfecha. Asimismo, un ansia puede reducirse sin la disminu- 
ción de una necesidad biológica: una rata hambrienta será recompensada con agua 
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con sacarina, que es dulce pero sin valor nutritivo; un bebé hambriento puede 
tranquilizarse al chupar una sustancia u objeto que no es alimenticia. Éstos son 
ejemplos de lo que Hull entendió por reducción de los estímulos de impulso en lu- 
gar de reducción de la necesidad. En el reforzamiento primario, los dos eventos 
(la reducción del impulso y la reducción de los estímulos de impulso), se asocian tan 
estrechamente que no importa cuál de los dos se considera reducido. Pero las ne- 
cesidades pueden insumir tiempo para su satisfacción (como el lapso requerido 
para digerir el alimento), mientras que los incentivos (incluyendo la comida) ope- 
ran rápidamente como reforzadores, de una forma muy parecida a como se espera 
que funcionen los estímulos. Además, a medida que el reforzamiento secundario 
obtenía mayor prominencia en las teorías del reforzamiento, la teoría de la reduc- 
ción del estímulo se hizo aún más atractiva. Esto es así porque un valor de refor- 
zamiento secundario se vincula a los estímulos que pueden introducirse con rapi- 
dez y de modo gradual. 

Hull creía que las variables de recompensa que afectan al nivel de ejecución de- 
berían reflejarse en el límite M, hasta el cual crecería la fuerza del hábito en condi- 
ciones de reforzamiento dadas (véase la ecuación 2). Así, por ejemplo, como se 
sabía emplricamente que la ejecución instrumental era más rápida si el aprendizaje 
ocurre con una recompensa más grande, y más lenta si la recompensa se demora 
después de la respuesta, Hul! sencillamente postuló que en la ecuación 2 M era 
una función creciente de la cantidad de recompensa dada en un ensayo, y una fun- 
ción decreciente de la demora de la recompensa. Esto equivale a asumir que el or- 
ganismo aprende un hábito con mayor fuerza cuando la recompensa es grande y se 
entrega con rapidez. 

Hull suponía que el hábito era permanente y que nunca disminuía (recuérdese 
que la ausencia de recompensa tan sólo acumula la inhibición condicionada para 
contrabalancear a H durante la extinción). Estas dos premisas muy pronto causa- 
ron problemas; aparecieron resultados que mostraron que continuar el entrena- 
núento de animales con una recompensa grande (o inmediata), cambiando a una 
recompensa más pequeña (o demorada) disrninuía su ejecución hasta un nivel 
apropiado a esa recompensa menor. Hull palió con facilidad el problema teórico al 
suponer (1952a) que la recompensa afectaba a la motivación de incentivo (lama- 
da K) más que el límite de la fuerza de hábito de la respuesta, y que el potencial de 
reacción positivo neto era el hábito multiplicado por el impulso (DJ), ambos multi- 
plicados por la motivación de incentivo (X). Aquí se considera a las variables de re- 
compensa como factores de ejecución más que como factores de aprendizaje, y se 
suponía que M tenía el mismo valor fijo. No obstante, Hull se aferró a su posición 
de que la adquisición del hábito requería de cantidad mínima de reforzamiento para 
que se desarrollara hasta su límite fijado. 


El papel del impulso 


Enla teoría de Hull el concepta de impulso era muy importante, y tenía tres dis- 
tintas funciones: 

1. Sin impulso no habría reforzamiento primario, ya que éste requiere de la dis- 
minución rápida de algún impulso. Cada estado de necesidad o de impulso espe- 
cifica un conjunto de objetos-meta cuya consumación reduce la necesidad; estos 
actos consumatorios sirven como medios normales de reforzamiento primario. 
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2. Sin impulso no podría haber respuesta, ya que éste activa la fuerza de hábito 
hacia el potencial de reacción. Huli postulaba que el impulso (D) multiplica la fuerza 
del hábito (véase la figura 5.2), de modo que un estado de ''impuiso cero” implica- 
ría que ninguna tendencia de respuesta (E) podría exceder el umbral de reacción. 

3. Sin la distintividad de los estímulos internos proporcionada por los diversos 
impulsos (denominados estímulos de impulso), no habría ninguna regulación de los 
hábitos mediante el estado de necesidad del organismo, ningún medio para que 
aprendiera a dirigirse a un lugar en busca de agua cuando estuviera sediento, y a 
otro que le procurara comida cuando sintiera hambre. 

La primera de estas condiciones describe qué tipos de objetos-meta se refuer- 
zan cuando el sujeto se encuentra en un particular estado de necesidad, y describe 
por qué estos estímulos particulares son reforzados. La segunda condición le atri- 
buye potencial energizante a un impulso; incita al animal a la acción en dirección a 
la satisfacción de la necesidad. La tercera condición adjudica a los impulsos un pa- 
pel discriminativo o de dirección en la conducta. 

Sin embargo, Hull se topó con algunas dificultades al intentar precisar su noción 
de impulso. Pensaba que todos los impulsos provenientes de tudas las fuentes 
contribuían a nn fondo común general de energía, que se indicaba con D, el ener- 
gizador (multiplicador) de todos los hábitos, Así, una respuesta entrenada bajo un 
impulso (de hambre) todavía podría ser energizada e incitar a la acción durante 
pruebas especiales realizadas mientras el animal operaba bajo un impulso distinto 
(por ejempio, la sed). No obstante, reconoció el problema de que ciertos hábitos 
eran relevantes para algunos impulsos pero irrelevantes o contrarios a otros. Por 
ejemplo, intuitivamente no parecía correcto que los impulsos aversivos (dolor, 
miedo) activasen los hábitos de búsqueda de comida. Y cuando comenzaron a es- 
tudiarse directamente las interacciones de los impulsos se descubrió que el ham- 
bre y la sed estaban muy entrelazados; un ejemplo común es que un hombre se- 
diento con la garganta reseca no es propenso a comer panecillos secos a no ser 
que su hambre haya llegado a límites extremos. Aunque Hull era consciente de es- 
tos problemas (creía que algunos podían manejarse mediante la función selectiva 
de los estímulos de impulso), de todas formas siguió adelante y postuló una ecua- 
ción particular para combinar las fuerzas de impulso “relevantes” e ““irrelevan- 
tes””, a fin de obtener un índice multiplicador efectivo. Pero la ecuación pasaba por 
alto las dificultades conceptuales básicas de su hipótesis de un fondo común de in- 
pulso generalizado, 


Los postulados de la inhibición 


Las nociones de Hull acerca de la inhibición se recabaron de dos fuentes: la teo- 
ría sobre la fatiga causada por la ejecución repetida de reacciones motoras (el /; 
de Hull); y las ideas de Pavlov en torno a la inhibición interna (condicionada), ge- 
nerada por el no reforzamiento durante la extinción. Para Hull, al igual que para 
Pavlov, la inhibición condicionada (sf¿) era una forma aprendida de inhibición acti- 
va, una oposición aprendida a una respuesta específica. Incluso se hizo algún in- 
tento por mantener una interpretación de la reducción de impulso sobre la manera 
en que se presenta el hábito de '“'no responder'*. Supóngase que la reacción R ne- 
cesitara de mucho esfuerzo y generara un gran impulso aversivo (fatiga); el detener 
o abandonar la respuesta se reforzaría entonces por la reducción inmediata de la 
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fatiga. Por lo tanto, la inhibición condicionada se basaría en un hábito de asociación 
para la “detención de R?””. Sin embargo, la interpretación de impulso de la fatiga 
(y) es un arma de doble filo, ya que si (/¿) es como un estado de impulso debería 
entrar dentro del fondo común de impulso general (D), como preveía Hull. Ade- 
más, 7, debía multiplicar su hábito sg, como en la fórmula A x D. En vez de ello, 
Hull presuponía que 7; y sp sencillamente se sumaban para formar un compuesto 
inhibitorio que se restaba al potencial excitatorio para configurar la respuesta. Esto 
constituía una inconsistencia en el tratamiento de los hábitos positivos y nega- 
tivos, que Hull reconoció pero no rectificó. 

Usó los conceptos de inhibición para inferir diversos fenómenos de interés, 
aprovechando los factores que incrementan la fuerza de fp y de sfp. Por ejemplo, 
los ensayos sumamente masivos con una respuesta difícil producen el fenómeno 
conocido como decremento de trabajo. y un periodo de descanso después de esas 
provocaciones masivas produce cierta recuperación de la respuesta motora. En la 
extinción no reforzada de los reflejos condicionados simples se encuentran efectos 
similares. Éstas eran deducciones poco sorprendentes, dadas las bases en que se 
sustentaba su formulación, 

Los postulados de Hull acerca de la inhibición especifica salieron bastante mal- 
trechos a la luz de los subsecuentes ataques conceptuales y empíricos. (Koch, 
1954; Gleitman, et al., 1954.) Por ejemplo, debido a alguna razón inexplicable, Hull 
relacionaba la resistencia a la extinción con la fuerza neta de la respuesta, al propo- 
ner una fórmula matemática ed hoc en lugar de inferir tal relación de la fuerza neta 
y sus postulados acerca de los ensayos no reforzados y la intensificación del sl. 
Esto no importa, ya que es evidente que una teoría no elaborada de la inhibición no 
podía comenzar por explicar la creciente resistencia a la extinción ocasionada por en- 
trenamiento parcialmente reforzado. Además, los postulados implican la absurda 
conclusión de que la inhibición condicionada de una respuesta debería adoptar, a la 
postre, la tendencia de hábito positivo de la misma. Por un lada, para las respuestas 
de encender y apagar, el “detener” la respuesta (digamos, detenerse al final de 
un carril) siempre está en relación temporal más cercana con la recompensa (co- 
mer) que la respuesta positiva (correr), par lo cual ““detenerse'' debería refor- 
zarse más favorablemente. Así en ese aspecto el condicionamiento debería ser im- 
posible. Segundo, para mencionar otra falla, aunque Hull indicaba un límite M al 
crecimiento de la fuerza del háhito, el límite de crecimiento del ¿1¿ era sencilla- 
mente el nivel prevaleciente del hábito positivo. Pero esto significa que a medida 
que el entrenamiento continúa y el hábito positivo alcanza sus límites, cada ensayo 
acumula cierta fatiga, y por lo mismo teóricamente algunos deberían sumarse has- 
ta llegar al valor real del hábito. Como la ejecución refleja la diferencia entre las 
tendencias positivas e inhibidoras, la inferencia anterior sugiere que las curvas del 
aprendizaje deben incrementarse y, con la práctica continua, ceder y disminuir, lo 
cual es absurdo. Taj vez estas deficiencias sean cuestiones menores que podrían 
subsanarse con una atención más profunda sobre los detalles en la formulación de 
las premisas de la inhibición o de las leyes de encadenamiento. 

Alrededor de los postulados de la inhibición se suscitaron otros dos grandes pro- 
blemas conceptuales: 2) el hecho de que algunas respuestas fáciles (como el par- 
padeo, la RGP, la dilatación de la pupila) sufran de una extinción relativamente rápida, 
mientras que los principios de Hull pronosticaban que tales respuestas se ex- 
tinguen con mucha lentitud porque producen muy poca fatiga por ensayo: y 5) la 
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noción de una **“no-respuesta'' (que subyace en la inhibición) estaba mal definida, 
y parece conducir a un rompecabezas conceptual. Para cualquier R dada, ¿cuál es 
su no-R? ¿Cuántas diferentes R ejecuta un organismo en un momento detetmi- 
nado? ¿una?, ¿cinco?, ¿cinco mil? Al parecer es mejor identificar la extinción 
—como lo hiciera Guthrie— con la adquisición de conductas competidoras (de in- 
terferencia) particulares; aunque, a decir verdad, Guthrie nunca fue muy explícito 
acerca de lo que estas respuestas competidoras eran en términos generales, 

Según se desprende de estos Comentarios, la formulación específica de Hull del 
I, y el el, no gozó de una aceptación total, aunque desde el comienzo se reconoció 
la necesidad de algún tipo de constructo inhúbitorio. Por ejemplo, Spence (1936) 
presentó una formulación un tanto general y evasiva de la inhibición, debido a la 
respuesta no reforzada en el aprendizaje de discriminación que ha resistido mejor 
la prueba del tiempo. Más tarde, Amsel (1958, 1962) identificó la frustración como 
la base que subyace en los factores inhibitorios condicionados en el condiciona- 
miento del apetito. Más adelante examinaremos estos términos. 


El sistema conductual final 


La última obra de Hull A behavior system que apareció en 1952, poco después de 
su muerte, contenía algunas revisiones de sus postulados, así como numerosas 
aplicaciones. Intentaba explicar una variedad de conductas más complejas, como 
el aprendizaje por ensayo-error, el aprendizaje de discriminación, el aprendizaje 
de laberinto y la resolución de problemas. 

Ya señalamos algunas diferencias entre los postulados miciales y finales de Hull.! 
El primer cambio aparece en la concepción del reforzamiento primario. Mientras 
que en los postulados de 1943 este reforzamiento depende de la reducción de la 
necesidad (de allí la reducción en D), en 1952 depende principalmente de la reducción 
de los estímulos producidos por el impulso. 

La segunda variación de importancia es que la ““bondad'” del reforzamiento 
no influye sobre la fuerza del hábito, siempre que haya alguna cantidad mínima no 
especificada; lo que cuenta es sólo la frecuencia con la que han ocurrido los ensayos 
reforzados. Así, se trata básicamente de una teoría de contigilidad en la formación 
de asociaciones. 

El tercer cambio de relevancia consiste en la adición de factores no asociativos 
(no aprendidos) que afectan al potencial de reacción. Aunque en el texto de 1943 
se habían reconocido algunos de ellos, ahora se les incorporó de modo distinto: 
como multipbcadores que afectan al potencial de reacción mediante la multipli- 
cación de la fuerza del hábito. La constitución del potencial de reacción positivo se 
convierte ahora así en: 


E=HxDxVxK 
donde Y es la bondad del estímulo evocador (una función de la intensidad del EC 
Una exposición crítica de los postulados se encuentra en la segunda edición de este libro (Hilgard, 


1956, págs. 127-150). El tratamiento que Hull hace de ellos es más completo en su obra Essentials of 
Behavior (1951) que en A behavior system (19524). 
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en una situación pavloviana), y K es la motivación de incentivo basada en la canti- 
dad y en la demora de la recompensa. 

Debe notarse el nuevo papel de la cantidad del incentivo (X). En la versión de 
1943 se creía que la cantidad de incentivo limitaba la cantidad máxima de la fuerza 
del hábito que podía adquirirse, En 1932, la cantidad de reforzamiento en el en- 
sayo previo determina el vigor de la respuesta (potencial de reacción) en el ensayo 
siguiente, mientras que no afecta a la fuerza del hábito. Esto permite que la ejecu- 
ción varíe rápidamente hacia arriba o hacia abajo como respuesta a los cambios en 
la recompensa, Aunque se presentan otras pequeñas modificaciones, vale la pena 
citar una que refleja un cambio de interpretación: la concepción de la influencia de 
la demora en el reforzamiento. Como una primera modificación, la demora en el 
reforzamiento produce ahora un menor potencial de reacción (¿E ¿) mientras que an- 
tes supuestamente causaba menor fuerza del hábito (sfT,). Pero los intervalos tenr 
porales también han disminuido: en la versión de 1943, el gradiente principal para 
una sola respuesta reforzada se extendía hasta quizá 60 segundos (1943, pág. 145); 
enla versión de 1952, no se prolonga a más de 5 segundos (1952a, pág. 131). El 
acortamiento del gradiente se produce a medida que el reforzamiento secundario 
gana más importancia en opinión de Hull, como un mecanismo teórico para generar 
gradientes más amplios de reforzamiento. Hull había sido influido por la sugerencia 
de Spence (1947) de que todos los gradientes pueden generarse a partir de refor- 
zamientos secundarios inmediatos u otros mecanismos intermedios. 


Mecanismos intermedios derivados 


El sistema de Hull se clasifica como reduccionista, en el sentido de que los fenóme- 
nos más complejos se deducen con base en los fenómenos y relaciones presumi- 
blemente más simples y básicos. En este sentido, los fenómenos más complejos 
se “reducen”? a los más sencillos mediante el análisis. Es característico que todos 
los sistemas de este tipo intenten explicar la conducta que es superficialmente dis- 
iinta de aquella de la cual se derivaron los postulados. En otras palabras, Hull no 
sólo intentaba sistematizar la descripción de las ratas hambrientas que oprimían 
palancas para obtener comida, a partir de lo que se deriva la mayor parte de los da- 
tos para su posterior conjunto de postulados. Más bien, trataba de llegar a las le- 
yes básicas de la conducta, al menos las del comportamiento de los mamíferos, 
con inclusión de la conducta social del ser humano. Muchas de sus explicaciones 
deductivas más brillantes acerca de los fenómenos complejos figuran en sus ar- 
tículos iniciales, antes de que enunciara sus sistemas de postulados.* 

Para salvar la brecha entre los experimentos simples de laboratorio y la conduc- 
ta más familiar de los organismos que se adaptan a un ambiente complejo, Hull infi- 
rió unos cuantos mecanismos intermedios. Cuando estos mecanismos están dis- 
ponibles, se les puede usar como herramientas teóricas para explicar muchas más 
variedades de conducta. Aquí consideraremos tres de ellos: el papel directivo de 
Ls respuestas meta anticipatorias, el gradiente de reforzamiento (lamado original- 
mente gradiente meta) y la jerarquía de familia de hábitos. 


“Para una introducción a las deducciones disponibles antes de 1940, véanse los sumarios en Hilgard 
y Marquis 11940); aprendizaje de laberinto, págs. 216-221; aprendizaje verbal serial. págs. 221-226; 
experimentos de razonamiento, págs. 236-241; colocación de una barrera, págs. 242-242. 
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Respuestas meta anticipatorias 


Muchos de los estímulos presentes en el momento de alcanzar la meta también 
lo están desde antes. Se incluyen los estímulos del impulso interno (lo que Guthrie 
denotnina estímulos de mantenimiento), estímulos ambientales presentes antes 
del reforzamiento y durante su transcurso, huellas de los primeros estímulos que 
perseveran en su dirección hacia la meta, y estímulos provocados por los mismos 
movimientos del animal, Hull presuponía que todos estos estímulos se condicionan 
a la respuesta meta (comer y salivar) en un grado que depende de su disponibilidad 
de huella en el momento en que ocurre la respuesta meta. Por lo tanto, al reacti- 
var una secuencia de actos que conducen a una meta, como al correr por un labe- 
rinto, estos estímulos condicionados a la respuesta meta podrían provocar fraccio- 
nes de la respuesta meta previas a la consecución de dicha meta. Estas respuestas 
meta anticipatorias y fraccionarias (R¿S) constituyen importantes integradores de 
cadenas de conducta en el sistema de Hull, y él las empleaba con mucho ingenio. 

Las respuestas anticipatorias fraccionarías dan lugar a los estímulos (S¿), a los 
cuales es posible asignar diversas funciones. Primero los estímulos S, pueden 
condicionarse a respuestas diferenciales y ayudar así a provocarlas, Por consi- 
guiente, a una rata se le puede enseñar con mayor facilidad a girar a la izquierda en 
un laberinto blanco y a la derecha en uno negro si la recompensa es cualitativa- 
mente diferente en las dos situaciones que habrán de discriminarse (por ejemplo, 
alimento en polvo versus una solución de sacarosa). La discriminación sobre cuál 
vuelta dar y en qué laberinto es auxiliada por el +S diferente que conduce a S,¿S 
distinto en las dos situaciones, y el S¿5 diverso se asocia diferencialmente con las 
respuestas de dar vuelta a la izquierda o a la derecha. Segundo, el S¿S puede ser- 
vir como equivalente de “ideas de dirección”, '“propósitos”* o “intenciones”. En 
tales Justraciones. Hull se refería al r,; como un “acto de estímulo puro''; es de- 
cir, un acto que funcionalmente proporciona un estímulo que mantiene un papel de 
dirección para guiar una cadena de conducta, Un ejemplo sería el de un niño que 
piensa o se dice a sí mismo “galleta”' a medida que ensambla y recorre los pasos 
complejos requeridos para empujar una silla, subirse a ella y alcanzar la caja de 
galletas. 

Hull también supuso que el condicionamiento de un 7, apetitivo sustenta a los 
fenómenos del reforzamiento secundario positivo (o aprendido). Si el pareamiento 
de un £C con un reforzador primario positivo hace que éste se condicione al +, 
entonces ese EC servirá como reforzador secundario. Hull conjeturaba que la 
excitación condicionada del mecanismo r¿-S¿ era reforzante de modo innato, Se 
explicarían así muchos hechos relacionados con los reforzadores secundarios: el 
hecho de que muestran adquisición, extinción, generalización del estímulo y refor- 
zamiento parcial, afecta su persistencia y varía con la magnitud de la recompensa 
en la cual se basan. Al preguntar por qué el +; no refuerza a 5u propia provocación 
hacia el EC, en la hipótesis de Hull se presenta un pequeño problema lógico. Si lo 
hiciera, la extinción de un reflejo salival condicionado, por ejemplo, sería imposi- 
ble. Resulta evidente que en la teoría debe descartarse esa posibilidad. 

Hull también utilizó el mecanismo ?¿-S¿ para describir los demás mecanismos 
del gradiente de meta y la jerarquía de familia de hábitos, conceptos que veremos 
a continuación. Sin embargo, el punto importante es que con base en un principio 
de condicionamiento simple (es decir, un r¿ que se conecte con estímulos ante- 
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tiores en una Secuencia instrumental), Hull infirió un mecanismo de generalidad 
más amplia (por ejemplo, el papel rector del S..) 


El gradiente de reforzamiento 


Un intervalo temporal de gran relevancia en el condicionamiento instrumental es 
aquel que media entre la ocurrencia de la respuesta crítica y la recepción del refor- 
zamiento. La medición del gradiente se efectúa en las situaciones de condiciona- 
miento instrumental (por ejemplo, presionar una palanca o correr par un pasadizo 
a fin de obtener una recompensa alimenticia) o en una situación de aprendizaje se- 
ketivo (por ejemplo, un mono presiona un panel rojo o verde, y recibe una bolita 
de azúcar en algún intervalo demorado). En tales experimentos, la demora de la 
recompensa generalmente retarda el aprendizaje o degrada la ejecución, y esto es 
más acentuado cuanto más prolongada sea la demora. Con base en algunos resul- 
tados anteriores de experimentos con ratas que presionaban palancas, Hull había 
deducido una demora declinante del gradiente de reforzamiento que era muy 
corta, **posiblemente no superior a 30 segundos, y muy posiblemente por debajo 
de 60”. 

Pero comenzaron a presentarse toda suerte de complicaciones para este postu- 
lado, ya que en otrus experimentos se descubrió que los valores específicos de la 
demora en los cuales no pudría producirse el aprendizaje dependen críticamente 
de la disposición experimental, en especial de la naturaleza de los cambios de estí- 
mulo correlacionados con la respuesta correcta y la naturaleza de las actividades in- 
ducidas en el sujeto durante el intervalo de demora. Spence (1947) señaló la forma 
en que la demora del gradiente de recompensa dependía de manera crucial de la 
presencia o ausencia de estímulos reforzantes secundarios después de la respues- 
ta correcta, particularmente en el aprendizaje selectivo. Si la respuesta correcta 
produce de inmediato un estímulo distintivo asociado con la recompensa primaria 
(independientemente de su retraso), mientras que un error conduce a un estímulo 
diferente, el primer estímulo distintivo actuará como un satisfactor inmediato que 
refuerza a la respuesta correcta, Por ejemplo, en un experimento Wolfe (1934) 
usó un laherínto en forma de T que conducía a cajas meta diferenciadas donde la 
recompensa se proporcionaba a la respuesta correcta después de una demora de 
20 minutos; a pesar de este retraso, las condiciones todavía eran adecuadas para 
la operación del reforzamiento secundario inmediato a la respuesta elegida de dar 
la vuelta en el extremo apropiado de la caja; por lo tanto, el aprendizaje rápido aún 
podría mostrarse con un retraso de 20 minutos en la recompensa. Como un se- 
gundo ejemplo, en la situación de presionar una palanca se consideraba que las 
huellas propioceptivas de haberla oprimido persistían durante varios segundos y. 
al ser pareadas con una recompensa posterior de comida, se convertían en estí- 
mulos reforzantes secundarios que ocurrirían de inmediato, desde luego, después 
de cualquier recurrencia ulterior de la acción de presionar la palanca. Además, 
Spence (1947) demostró que si fuera pasible eliminar los “sostenes de estímulo”' 
externos, 0 interferir con los sostenes internos como posibles fuentes de refar- 
zamiento secundario inmediato, entonces el “gradiente verdadero” de la demora 
del reforzamiento primario sería de alrededor de 5 segundos para una rata. Esto 
parece cercano a lo que cabría esperar para la memoria de un evento E-R reciente. 
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Al combinar el reconocimiento de un gradiente primario corto y los estímulos 
reforzantes secundarios, diseminados a lo largo de la ruta de un laberinto, Hull y 
Spence infirieron el gradiente de meta, por medio del cual los componentes más 
tempranos de una larga cadena de conductas serían reforzados y fortalecidos en 
un grado menor que los componentes conductuales más cercanos (temporalmen- 
te) a la meta. Una de las aplicaciones originales de este principio consiste en 
explicar la eliminación ordenada de errores en las ratas que aprenden laberintos 
largos en forma de 7 múltiple. Según el principio, las respuestas más cercanas a la 
meta se refuerzan más fuertemente que las alejadas, de modo que se prefieren las 
sendas cortas a las prolongadas, los tramos ciegos (elecciones incorrectas) más 
cercanos a la meta se eliminan con mayor facilidad que los más alejados, los calle- 
jones sin salida grandes se eliminan más fácilmente que los más cortos, etcétera. 
(Hull, 1932). El fundamento de esta deducción es que una diferencia fija en el 
tiempo entre un giro correcto en una unidad de laberinto múltiple y un giro inco- 
rrecto en ese mismo lugar, que debe ser anulado, es más discriminable cuando 
más cerca se encuentre en el tiempo esa unidad del punto de recompensa; prefe- 
rentemente como la ley Weber-Fechner para la discriminación de dos intervalos 
temporales. El principio del gradiente meta se aplicó más tarde a los experimentos 
que implicaban la colocación de barreras entre el sujeto que aprendía y una meta 
visible, y Hull propuso que la conducta de acercamiento a la meta percibida debe- 
ría variar de acuerdo con el gradiente meta. Es decir, mientras más se acercara el 
sujeto a la meta, más fuerte sería el poder de evocación de respuesta de ésta. 
Esto explicaba, por ejemplo, por qué los animales tenían dificultades particulares 
para resolver problemas de *'dar una larga vuelta” (rodeo), al estar colocados 
muy cerca de la comida ubicada al otro lado de una pantalla. En estos problemas, 
el animal debe abandonar al acercamiento directo y alejarse de la comida a fin de 
rodear la pantalla. 


La jerarquía de familia de hábitos 


Un tercer principio derivado es el de la jerarquía de familia de hábitos. Como en 
el ambiente natural generalmente hay múltiples rutas entre un punto de partida y 
una meta, el organismo aprende formas alternativas a fin de moverse desde un 
punto de partida común hasta una posición meta también común, donde encuentra 
la satisfacción de su necesidad. Estas opciones constituyen una ““familia”” de res- 
puestas equivalentes, denvminadas familia de hábitos, debido a un mecanismo 
integrador inferido. La integración dentro de una familia se logra mediante la reac- 
ción meta anticipatoria fraccionaria, presente a medida que se ejecuta cada res- 
puesta alternativa. Esta reacción proporciona un estímulo (S¿) al cual se condi- 
cionan las diversas respuestas manifiestas. A través de la acción diferencial de los 
gradientes derivados de reforzamiento, algunas respuestas están condicionadas al 
S¿ con menor fuerza que otras. Las respuestas iniciales de rutas más largas, por 
ejemplo, están más alejadas del reforzamiento que las respuestas iniciales de rutas 
más cortas, Por esta razón las segundas están más fuertemente reforzadas, y se 
encuentran condicionadas con mayor vigor al S;. Como consecuencia, los patro- 
nes opcionales de conducta se disponen en un orden de preferencia. Las rutas 
menos favorecidas sólo se escogen cuando las predilectas están bloqueadas. Este 
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conjunto de hábitos alternativos, integrados por un estímulo meta común y dis- 
puestos en orden preferencial, constituye una jerarquía de familia de hábitos. 

Hull infirió además que si un miembro de una jerarquía de familia de hábito se re- 
fuerza en una situación nueva, todos los demás miembros comparten al instante la 
tendencia a ser evocados como reacciones en esa situación (Hull, 1937). Esto per- 
mite explicar las equivalencias de respuesta y otras reacciones apropiadas en si- 
tuaciones nuevas o problemáticas, como aquellas que aparecen en los experimentos 
de razonamiento. : 

El principio mencionado se aplicó por vez primera al aprendizaje de laberinto 
(Hull, 19344), donde sirvió fundamentalmente para explicar la tendencia de la rata 
a entrar en primer término en callejones sin salida que apuntan en dirección de la 
caja meta, aun cuando el animal nunca hubiese entrado en esos tramos ciegos y 
nunca hubiese sido reforzado en esa situación de laberinto. Se suponía que la 
orientación de meta representaba una transferencia inapropiada de hábitos espa- 
ciales adquiridos cuando el animal vagaba con libertad en un campo abierto. Otra 
explicación se relacionaba con los experimentos de desvío (Hull, 1938), El grado 
de dificultad «) alejarse de una meta percibida detrás de una barrera depende de 
l presencia de jerarquías de familia de hábitos, así como de gradientes meta. En la 
experiencia usual del espacio abierto, la senda favorecida es la línea recta entre el 
sujeto que aprende y la meta. La respuesta inicial que se favorece en segundo lugar 
es aquella que forma el ángulo más pequeño con la meta. Cuanto mayor sea el án- 
gulo, menos favorecida será la respuesta inicial en esa familia de hábitos cons- 
truida en la experiencia previa. Por lo tanto, cuando se ve bloqueado, el sujeto 
prefiere una senda que siga un ángulo recto a aquella que requiera que vuelva la 
espalda a la meta. En algunas situaciones objetivas es posible que incluso prefiera 
una senda más larga que una corta, si la jerarquía de familia de hábito resulta ser 
engañosa. 


El énfasis cuantitativo de Hull 


Aunque nuestra exposición ha tendido a minimizar la cuestión, durante sus últi- 
mos años Hull se interesó cada vez más en los aspectos cuantitativos de su teoría, 
Intentó graduar o medir la fuerza de la respuesta en términos cuantitativos y de- 
terminar el valor numérico exacta de las constantes particulares, en las ecuacio- 
nes en las cuales se relaciona una variable interviniente con una independiente o 
con variables dependientes. Lo más notable es que intentó inferir predicciones 
cuantitativas para los resultados de nuevos experimentos conductuales más aliá de 
aquellos que formaron parte del conjunto original de postulados. En esencia, su úl- 
tima obra (1952a) consistía en una deducción cuantitativa tras otra acerca de la 
ejecución en una variedad de experimentos relacionados con el encadenamiento 
serial de las respuestas, el aprendizaje de discriminación de estímulo, el aprendi- 
zaje latente, la conducta orientada espacialmente en campos abiertos, problemas 
de “rodeo”', cambios de incentivo, conflicto de acercamiento-evitación. habi- 
lidades motoras, y muchas otras situaciones que estudian los psicólogos. Hull co- 
menzaba sus deducciones tomando sus postulados y asignando ciertos valores hi- 
potéticos iniciales a las numerosas variables intervinientes de la teoría, y se res- 
tringía entonces a una caracterización irreal y sin complicaciones de la situación 
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conductual, creando nuevas reglas para las combinaciones cuantitativas a medida 
que se las necesitara. A la postre, se obtuvieron algunos cálculos finales de la ten- 
dencia de reacción neta, que podrían compararse con alguna medición del compor- 
tamiento de los animales en el experimento que se modelaba. Si había pronosti- 
cado las tendencias cualitativas (ordinales) correctas en los datos, decía satisfecho 
que *“el teorema había sido verificado””. Hull resume a menudo los éxitos de su 
teoría en términos del número de ''teoremas confirmados'* o de alguna forma 
parecida. 

A pesar del apego por los aspectos cuantitativos de su teoría, la generación sub- 
secuente de psicólogos había un consenso general —incluso entre aquellos que 
simpatizaban con Hull— de que los detalles cuantitativos específicos eran los más 
arbitrarios y los menos importantes, interesantes o duraderos de la teorización de 
aquél (para este puntv de vista, expresado por im neohulliano, véase Amsel, 
1965). Según los estándares modernos en la teoría del aprendizaje matemático, 
Hull carecía de un sistema matemático dúctil. Es decir, tenía demasiados paráme- 
tros qué medir y una teoría de la medición demasiado débil para que fuera eficaz en 
lo que toca a los detalles cuantitativos de los datos. Sus deducciones matemáticas 
también son sospechosas en los detalles (véase la discusión de casos realizada por 
Cotton, 1955; Koch, 1954; o la edición anterior de esta obra, Hilgard y Bower, 
1966, págs. 170 a 180), ya que generalmente implican una plétora de premisas 
idealizadas, asignaciones arbitrarias de valores a variables intervinientes, y reglas 
ad hoc inventadas para manejar los problemas especiales que surgen en cada 
deducción. En tales circunstancias, es más aconsejable considerar la teoría de Hull 
a un nivel iníormal y verbal, como lo hemos hecho aquí, en torno de los conceptos 
e ideas interrelacionadas que tienen una significación más duradera. Sin embargo, 
cabe señalar que fueron las ambiciones cuantitativas del programa de Hull y los ar- 
gumentos que en su favor estipulara de modo muy persuasivo, los que estable- 
cieron la base para desarrollos posteriores enla teoría del aprendizaje matemático. 


LOS NEOHULLIANOS 


Durante unos 20 años, aproximadamente desde 1930 hasta 1950, Hull fue un 
personaje importante en el Instituto de Relaciones Humanas de la Universidad de 
Yale, donde no sólo influyó en sucesivas generaciones de graduados y culegas en 
psicología sino que dejó su sello en estudiosos de campos cercanos a las ciencias 
de la conducta, particularmente en la antropología y en la psiquiatría. La riqueza de 
sus contribuciones no aparece en toda su extensión en sus artículos y libros, como 
lo atestiguan los conjuntos de Seminar Notes y Memoranda desde 1934 hasta 1950. 

Entre quienes recibieron una influencia más o menos directa de Hull y siguieron 
escribiendo en el campo del aprendizaje, Neal E. Miller (1959) y O. Hobart 
Movrer (1960) han adoptado estilos propios y, aunque permanecen dentro de la 
tradición de la teoría del reforzamiento £-R, nunca emplearon el enfoque más for- 
nal de Hull. Kenneth Spence representa probablemente una continuación más di- 
recta de su tipo general de teorización, pero con razonables alteraciones, Su punto 
de vista se aprecia claramente en dos obras: Behavior theory and conditioning 
(1956), y un volumen de artículos escogidos titulado Behavior theory and learning 
(19605). Spence, que fue jefe del departamento de psicología de la Universidad de 
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lowa durante casi 25 años, influyó en muchos estudiantes en su tradición 
neohulliana; entre ellos se cuentan Abram Amsel y Frank Logan. Seguidamente 
examinemos a grandes rasgos las contribuciones de algunos de los neohullianos. 


N. E. Miller 


Miller tomó sus conceptos fundamentales de la teoría de Hull, pero los desa- 
rrolló de modo informal y los aplicó a una amplia diversidad de fenómenos conduc- 
tuales. Durante muchos años fue el principal delensor de la hipótesis estricta del re- 
forzamiento como reductor del impulso, y alternadamente la atacaba y la defendía 
onmo un acicate heurístico para avanzar en nuestra conceptualización de lo que 
hace que las recompensas sean reforzantes. Miller también desarralló la noción 
de impulso adquirido, que se refiere a los estímulos que a través de un proceso de 
condicionamiento termina por poseer las propiedades funcionales de un impulso, y 
cuyo mejor ejemplo es el miedo o ansiedad. En el análisis de Miller (1951), el 
miedo es una respuesta innata a la estimulación dolorosa, y en tanto respuesta se 
le puede condicionar a un estímulo antecedente .? Pero la respuesta de miedo tam- 
bién tiene efectos estimulantes, que son de dos tipos: primero, pueden servir 
como indicios discriminativos de modo que las respuestas diferenciales puedan 
vincularse a ellos; segundo, cuando estos estímulos de miedo se hacen lo bastante 
intensos, actúan como estímulos de impulso y motivación que fortalecerán res- 
puestas particulares que son instrumentales para escapar o evitar esas situaciones 
desagrabables y aversivas que provocan el miedo, Por último, cuando se eliminan 
los estímulos condicionados que originan la respuesta de miedo, el impulso se re- 
duce, lo cual permite el reforzamiento de cualquier respuesta instrumental que an- 
tecede a dicha remoción de los estímulos de miedo. Este conjunto de hipótesis se 
convirtió en la hase para el análisis del condicionamiento de evitación que hahría de 
dominar esa área de investigación durante varias décadas. A la postre, la teoría re- 
quirió de grandes modificaciones (véase Bolles, 1972). 

Otra contribución de Miller (1944) fue la elaboración y el desarrollo de una for- 
mulación precisa de la teoría del conflicto, que comenzó con algunas ideas de Lewin 
(1935). Considerénse dos diferentes lugares en el espacio, A y B, y supóngase 
gue en relación con cada lugar (*'meta””) el sujeto tiene una tendencia de acerca- 
miento, una de evitación o una combinación de acercamiento y evitación a un lugar 
o «otro, o a ambos. La situación está ideada de tal modo que el organismo se ve 
forzado a elegir, o al menos a comportarse preferencialmente respecto a las dos 
metas. Miller procedió a clasificar las situaciones y a indicar la conducta esperada, 
dadas ciertas fuerzas particulares de las tendencias de acercamiento y evitación. 
Así, por ejemplo, se espera que los conflictos puros de acercamiento-acerca- 
miento sean inestables y que se resuelvan en favor de la opción más fuerte o más 
atractiva; los conflictos de evitación-evitación conducen a una inmovilización esta- 
ble en un punto intermedio entre A y B; y las situaciones dobles de acercamiento- 


“Incidentalmente, era para Miller un problema saber cómo se reforzaba la respuesta de miedo; para 
ser consistente con su posición de reducción de impulso, tenía que argumentar que el comienzo del 
medo era retorzado por la aparición posterior de la estimulación aversiva dolorosa, una nasición acerca 
de la cua) él y Mowrerx habrían de discrepar. 
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Figura 5.3. Ilustración de los gra- 
dientes de generalización espa- 
cia! de la fuerza del acercamien- 
to y las tendencias de evitación 
trazados en comparación a la 
distancia desde la meta hacia el 
-— comienzo COMienzo de un pasadizo en lí- 


mela 
Distancia de la mota nea recta, 


evitación (que implican dos elecciones ambivalentes) conducen a oscilaciones, du- 
das, falsos comienzos, movimiento inicial en una dirección y después retomo, 
etcétera, 

La situación analizada con mayor frecuencia se refiere a la teoría de Miller de un 
conflicto simple de acercamiento-evitación, los componentes del cual aparecen en 
el diagrama de la figura 5,3. Aquí el objeto meta es al mismo tiempo una fuente de 
atracción y de repulsión que tienta al sujeto a acercarse a ella, pero negando una 
comunicación completa con la meta. Un arreglo experimental típico para el estudio 
de tal conflicto sería el de una rata hambrienta entrenada para correr por un pasa- 
dizo recto hasta llegar a una recompensa alimenticia; se somete al animal después 
del entrenamiento a una sene de descargas eléctricas dolorosas en la caja meta. 
Su tendencia de acercamiento a la comida se desequilibra por su temor a tal des- 
carga. Ambas tendencias muestran un gradiente meta que disminuye con la distan- 
cia desde la fuente de atracción o repulsión. 

Miller suponía que el gradiente de evitación tiene una inclinación más acentuada 
que el gradiente de acercamiento,* y que la tendencia neta a aproximarse a la meta 
dependía de la diferencia algebraica entre las tendencias de acercamiento y de evi- 
tación, En circunstancias apropiadas como las del diagrama de la figura 5.3, cuan- 
do la fuerza de la evitación excede a la del acercamiento a la meta, la teoría predice 
una verdadera conducta de conflicto. Si se le coloca al comienzo del pasadizo, el 
animal correrá hacia la meta, pero entonces se detendrá, se moverá hacia atrás y 
hacia adelante, avanzará un poco, retrocederá y por lo general oscilará alrededor 
del punto de equilibra E. Dicho punto se encuentra donde se cruzan los dos gra- 
dientes: es estable en el sentido de que cualquier desviación del animal del punto 
E hará que intervengan fuerzas tendientes a hacerlo regresar a E. 

Miller enumera un conjunto de variables que deben afectar la fuerza de la ten- 


$Como Miller y Murray (1952) han demostrado, esta premisa deriva de la idea de que la jendencia 
neta de evitación se basa en un impulso aprendido (miedo), que sufre decremento de generalización 
con la distancia de La meta, mientras que la tendencia de acercamiento regularmente se sustenta en un 
imptllso interno que es copstante sólo con el hábito, H, que revek la generalización del estímulo. 
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dencia de acercamiento y otro conjunto que afecta la de la tendencia de evitación. 
Las variaciones en éstas tendrían efectos predecibles sobre la conducta conflic- 
tiva. Por ejemplo, un incremento en el impulso de acercamiento debería acercar 
más al sujeto a la meta (el punto E se mueve a la izquierda), como también lo haría 
una disminución de la tendencia de evitación, aunque en cualquier caso el sujeto 
habría de experimentar mayor ansiedad que antes en los nuevos puntos de equilibrio. 

Miller dirigió una admirable serie de estudios que confrmaron y ampliaron este 
análisis del conflicto (Miller 1959). También amplió la misma teoría para analizar la 
noción freudiana de la conducta de desplazamiento (Miller, 19485), según la cual 
una persona selecciona un objeto meta similar (“un objeto de amor desplazado”, 
en la teoría de Freud), cuando es ambivalente y tiene muchos conflictos acerca de 
la elección de un objeto meta original. 

Con la ayuda de su colega John Dollard, aplicó estas hipótesis acerca del aprendi- 
zaje, los impulsos adquiridos y el conflicto al análisis del pensamiento, el lenguaje, la 
personalidad, la neurosis, la psicoterapia, la imitación y la conducta social. En esos 
análisis se liberaron considerablemente los conceptos del estímulo-respuesta. Por 
ejemplo, en su análisis de la conducta dependiente de igualación (una imitatipo 
*copia””), Miller y Dollard (1941) realizaron algo parecido a un análisis cibernético 
de diversos ejemplos conductuales simples. Veamos una ilustración. Un estu- 
diante aprendía a cantar en un tono, y en particular a cantar una melodía de modo 
que igualara con la voz de un maestro, La discrepancia percibida entre las notas 
del estudiante y del maestro se concebía como un indicio graduado que motivaba 
una alteración apropiadamente graduada y direccional en la respuesta vocal, de 
manera que la nota alterada que cantaba el estudiante parecía más cercana a la del 
maestro. Ésta es una respuesta relacional guiada por la retroalimentación de un ín- 
dicio relacional. Miller y Dollard concebían la reducción de la discrepancia como 
una recompensa secundaria para que el estudiante aprendiera a igualar su nota 
cantada con una escuchada, Tales análisis, y otros igualmente ingeniosos que apa- 
recieron en el hibro Persorality and psychuterapy (Dollard y Miller, 1950), contri- 
buyeron a convencer a los psicólogos de que una versión más liberal del enfoque 
de estímulo-respuesta-reforzamiento constituía una opción viable y sana para la 
teoría del aprendizaje. 

Más adelante, Miller concentró su atención en el análisis de los sustratos fisioló- 
gicos y bioquímicos de la motivación y la recompensa, áreas en las cuales también 
hizo contribuciones importantes (1958, 1965). Por otro lado, estaba a la van- 
guardia de los esfuerzos de investigación para condicionar de modo operante rmul- 
chas respuestas involuntarias del sistema nervioso autónomo. En el capítulo 9 
examinaremos estos importantes intentos de producir el aprendizaje visceral me- 
diante la biorretroalimentación. 


O, H. Mowrer 


Mowrer, un colega de Hull y Miller en la Universidad de Yale a mediados de la 
década de 1930, recibió gran influencia de éstos, pero también desarrolló su pro- 
Pio conjunto de hipótesis, Entre sus numerosas actividades, Mowrer mantuvo un 
interés constante por la interpretación de la ansiedad condicionada (generalmente 
impulsos condicionados) y el reforzamiento condicionado. Una de sus primeras 
opiniones (Mowrer, 1947) era que se necesitan dos “principios de reforzamien- 
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to'”: 1. la reducción del impulso refuerza y robustece las respuestas instrumentales 
que implican a la musculatura esquelética mediada por el sistema nervioso cen- 
tral; 2, las emociones como el miedo, la náusea y otras que involucran a la muscu- 
latura lisa (glándulas, vísceras, tejidos vasculares) mediadas por el sisterna nervio- 
so autónomo, se aprenden a partir de la contigitidad temporal completa de un EC 
con la provocación de la respuesta emocional. Así, por ejemplo, el simple parea- 
nuento de un timbre con descargas eléctricas basta para asociar al miedo con el 
timbre, pero se reforzaba alguna respuesta de evitación activa (como saltar sobre 
una barrera entre dos compartimientos), ya que reducía el impulso de miedo. Es- 
tas premisas configuraban la llamada teoría del aprendizaje de dos factores, que go- 
zó de gran aceptación entre muchos teóricos (incluyendo, por ejemplo a Skinner) 
durante varios años. 

Después de Miller y Dollard (1941), Mowrer efectuó un análisis particular del 
castigo que habría de tener una importancia central para alterar más tarde su con- 
cepción del aprendizaje y de la formación de hábitos. Para ilustrar este amálisia del 
castigo, considérese el caso de una rata hambrienta que se ha entrenado para opni- 
mir una palanca a fin de obtener comida, que comienza a recibir una descarga eléc» 
trica cada vez que presiona la palanca. Después de varias presiones y descargas, 
el animal disminuye su promedio y a la postre deja de oprimir la palanca: el castigo 
ha suprimido una conducta que era fuerte. Pero, ¿por qué?, ¿cómo podemos inter- 
pretar este fenómeno? Según Mowrer, los estímulos de retroalimentación propio- 
ceptivos de presionar la palanca se encuentran en una adecuada contigúidad ten 
poral con la descarga, de modo que los indicios asociados con la palanca, junto con 
aquellos indicios provocados por la respuesta de oprimirla, se condicionan al mie- 
do. En ensayos subsecuentes, sila rata comienza a acercarse a la palanca y se le- 
vanta para presionarla, estos incipientes movimientos le presentan al animal un 
patrón de estímulo propioceptivo que excita la ansiedad. Tales estímulos provo- 
cadores de ansiedad le impiden ejecutar toda la respuesta incipiente; la manera de 
escapar de estos indicios provocadores de miedo consiste en interrumpir y desis- 
tir del acto castigado: no hacer nada. Así, mientras en la situación de evitación 
activa el animal reduce el miedo y evita la descarga al saltar fuera de la caja de des- 
carga, en la situación de castigo la rata reduce el miedo y elude tal descarga no ha- 
ciendo nada. Esto había de convertirse en el análisis generalmente aceptado acer- 
ca de la manera en que opera el castigo en la inhibición de las respuestas (Bolles, 
1972; J. S. Brown y Jacobs, 1949; Dinsmoor, 1954). 

Pero Mowrer meditó en torno de la asimetría implícita en esta posición: como 
se afirmaba, las recompensas positivas fortalecen directamente los hábitos de las 
respuestas instrumentales, en tanto que los castigos operan de forma indirecta, 
no al reducir el hábito sino al hacer que los indicios de iniciar la respuesta se condi- 
cionen a) miedo, lo cual inhibe la “consecución completa”* de la respuesta. Obser- 
vó (1956) que la asimetría era innecesaria si sólo se reinterpretaba la noción de un 
hábito posifiva, como el de nuestra rata hambrienta que presiona una palanca para 
obtener comida. ¿Por qué no interpretar los hábitos positivos de la misma forma 
que él había considerado a los castigos, con la única excepción de invertir el signo 
del resultado anticipado? La retroalimentación propioceptiva de emitir la respues- 
ta correcta está en favorable contigúidad con el reforzamiento positivo (reducción 
de impulso), de modo que habría de adquinr capacidades reforzantes secundarias 
mediante el condicionamiento de contigilidad. Y por analogía con la forma en que 
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se impiden las respuestas castigadas incipientes, las respuestas recompensadas 
incipientes se deberían impulsar hasta su total ejecución, ya que su patrón de res- 
puesta propioceptivo está condicionado a la esperanza, a la expectativa de la re- 
compensa. En esta concepción no existe una conexión asociativa directa entre el 
estímulo externo y la respuesta instrumental, no hay un vínculo E-R en el sentido 
tradicional; más bien la estimulación de retroalimentación desde la respuesta co- 
rrecta se ha condicionado a una emoción positiva (esperanza o reforzamiento 
secundario), que excita o alimenta de energía hacia la ejecución de la respuesta. 

Como hemos visto en el capítulo 4, esta teoría es similar a la de Sheela y tam- 
bién al análisis de Estes acerca del papel de la recompensa en el condicionamiento 
instrumental. Sin embargo, puesto que Mowrer excluye los hábitos directos E-R, 
nos preguntamos de qué modo el organismo selecciona las respuestas que "'inicia- 
rá de modo incipiente””. Mowrer (1960) cree que el cerebro dirige una rápida ex- 
ploración de las representaciones centrales de un repertorio de respuestas, inhibe 
aquellas asociadas con el miedo y facilita las que se vinculan con la esperanza. Pero 
este mecanismo no se ha elaborado en detalle, ¿Qué es el mecanismo de explora- 
ción?; ¿qué se explora?; ¿cuántas respuestas posibles hay? ¿Cinco, cien, un mi- 
llón? ¿De qué forma el dispositivo almacena temporalmente los valores de la re- 
compensa esperada para cada alternativa explorada, y cómo compara entonces 
(oincluso discrimina) los cientos de valores explorados? Además, ¿cómo se reali- 
za todo esto con la gran rapidez que caracteriza a los hábitos bien practicados? Es- 
tas son complicadas preguntas que en verdad Mowrer nunca contestó en Su aná- 
hsis de retroalimentación provisional. No se trata aquí de problemas para las for- 
mulaciones particulares de la exploración de la recompensa esperada que hicieran 
Sheffield y Estes; como éstos presuponen conexiones directas £-R, consideran 
que la exploración de recompensa interviene en las decisiones del aprendizaje ini- 
cial antes de que los hábitos correctos se hayan seleccionado y estén adecuada- 
mente aprendidos. 

Debido a esta concepción del hábito corno el condicionamiento clásico de una 
emoción reforzante a algunos indicios producidos por la respuesta, Mowrer (1960) 
se preocupó por sistematizar las diversas clases de emociones condicionables en lo 
que toca a sus aspectos reforzantes, En la figura 5,4 pueden observarse las diver- 
sas posibilidades que Mowrer consideraba a partir de los sucesos reforzadores 
primarios de li descarga eléctrica o de la acción de comer, para un organismo 
hambriento. El diagrama debe leerse como el flujo de eventos en el tiempo (de 
izquierda a derecha) dentro de un ensayo de condicionamiento. El indicio A que pre- 
cede a la descarga (y provoca un incremento en el impulso del dolor) se condiciona- 
rá a una fracción de ese incremento de impulso, a la cual llamamos miedo o ansie- 
dad. Un indicio C pareado con el inicio de un reforzador positivo —como la acción 
de comer de un bebé hambriento— se condicionará a la reducción del impulso re- 
sultante: '“esperanza'* es el nombre que Mowrer da a la emoción que subyace en 
el reforzamiento secundario. Los tipos novedosos de relaciones condicionables 
que señala el antor se ilustran con los indicios B y D en la figura 5.4. El indicio B 
es aquel que señala la inminente terminación del dolor o la reducción del impulso. 
Por lo tanto, según las hipótesis de Mowrer el indicio B se asocia con el alivio del 
dolor. La validez del fenómeno del alivio, o la seguridad de que el dolor está a pun- 
to de concluir, es subjetivamente evidente para cualquier persona que soporta uno 
prolongado (por ejemplo, el que provoca el torno de un dentista). Para ese efecto 
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de alivio hay también una acumulación de evidencia conductual, particularmente 
pruebas de que los animales atemorizados o los que experimentan una descarga 
eléctrica pueden ser reforzados por los estímulos que se han asociado con la segu- 
ridad o con la terminación de la descarga. 

El otro nuevo arreglo en la figura 5.4 es el indicio D, pareado con la suspensión 
o eliminación de un reforzador positivo. Como ejemplos podrían mencionarse los 
indicios que anteceden a “quitarle un dulce a un niño”' o a retirar el bebedera de 
agua azucarada a una rata hambrienta. La idea es que tales indicios llegan a actuar 
como castigos secundarios por sí solos. 

En la figura 5.4 se ilustran las “emociones”? esperadas, condicionadas por varios 
arreglos entre dos indicios neutrales y los comienzos o terminaciones de los refor- 
zadores primarios. Una vez condicionados, estos estímulos pueden hacerse con- 
tingentes de alguna respuesta instrumental, de modo que incrementen o disminu- 
yan su frecuencia, 

En la figura 5.5 aparece un diagrama de los seis posibles resultados que siguen a 
la ocurrencia de la respuesta instrumental, y a éstos se les asigna las denomi- 
naciones que usaba Mowrer. En su concepción, un reforzamiento decremental es 
aquel que reduce (decrementa) un impulso que tiene un efecto positivo sobre la 
respuesta instrumental previa; un reforzamiento incremental incrementa (aumen- 
ta) un impulso y tiene un ejecto inhibitorio o de castigo sobre la respuesta previa, 
Debemos comprender, por supuesto, que estos resultados tienen sus efectos es- 
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Figura 5.4. Varios arrcglos pareados de condicionamiento. (a] Un indicio A que prece- 
de a un incremento de impulso causado por una descarga dolorosa se asocia con el 
miedo, Mientras que un indicio B que anuncia la compensación del dolor se asocia 
con el alivio de la ansiedad. (b) Un indicio € que antecede un decremento de impulso 
causado porque el animal hambriento come, se asocia con la esperanza, mientras 
que un indicio D que antecede al retiro de la recompensa se asocia con el desagrado 
ola frustración. 
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Figura 5.5. Clasificación de Mowrer de los seis tipos de reforzadores que pueden se- 
guir a una respuesta instrumental; aquellos resultados en las ramas ++ actúan 
como reforzadores positivos [reductores de impulso) para la respuesta; los resultados 
en las ramas — — actúan como reforzadores negativos o castigos para las respuestas. 


pecificados sobre la conducta sólo cuando el organismo se encuentra en el estado 
de impulso apropiado. Así, a un animal saciado no se le puede recompensar con ali- 
mento o con estímulos C asociados con comida, o castigo con los estímulos D aso- 
ciados con el retiro del alimento. De modo similar, un animal que no esté asustado 
no será reforzado por la presentación de un indicio B asociado con el alivio del mie- 
do o del dolor, 

Mowrer (1960) ha revisado evidencias que indican el valur heurístico de este 
sistema simétrico de clasificación, y desde entonces han aparecido muchas más. 
El estudio de Stea (1964) es ilustrativo de un experimento que muestra los efec- 
tos punitivos de los indicios (comu D) pareados con el retiro de la recompensa. 
Durante una fase inicial de condicionamiento de decepción, el investigador inserta 
un tubo para beber en la caja de una rata sedienta; cuando el animal comienza a be- 
ber del tubo, hace sonar un tono y retira el tubo de la caja (el tono antecede y si- 
gue al retiro del tubo unos cuantos segundos). Después de determinados ensayos 
comienza la segunda fase del experimento, durante la cual las ratas reciben un cierto 
número de ensayos libres y forzados en ambos brazos de un laberinto en forma de 
T, y se les recompensa con agua colocada en ambos extremos. Esto establece una 
ejecución de línea base de igual preferencia para los dos brazos del laberinto. En 
la tercera fase del experimento, Stea hacía sonar el tono de “*decepción”' cuando la 
rata iba a un sitio particular (por ejemplo, el lado izquierdo) del laberinto para con- 
seguir agua. Como resultado, los animales desarrollan una significativa predilec- 
ción por el lado opuesto. Los sujetos de control recibían el mismo tratamiento 
con la excepción de que el tono y el retiro del agua (o su presentación) sólo tenían 
una relación aleatoria en la primera fase, y no mostraban ninguna preferencia en la 
tercera para el lado sin tono. Así, para los sujetos experimentales el tono ha adqui- 
rido un valor negativo y actúa como castigador porque se ha asociado con la elimi- 
nación del agua o con la frustración de una respuesta consumataría. Por supuesto, 
este resultado es congruente con los indicios del tipo D que Mowrer identifica 
como castigadores. 
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Aunque tales sisternas de clasificación tienen su utilidad, no se les debe consi- 
derar como pruebas sustentadoras de la reducción del impulso de la recompensa 
sobre la cual Mowrer basaba su clasificación. Cualquier concepción hedonista de 
las actividades ““placenteras contra no placenteras'” podría haber sustituido los 
términos de Mowrer, teóricamente cargados de reforzamiento ''incremental”' o 
“'decremental”” del impulso. De hecho, ahora parece muy probable que la hipóte- 
sis de reducción del impulso sea empíricamente inadecuada (véase Hilgard y Bo- 
wer, 1956, págs. 481 a 487, para nuestra exposición anterior de estos proble- 
mas). Sin embargo, esta circunstancia no afecta al sistema de clasificación de los 
reforzadores que Mowrer ha propuesto. 


K. W, Spence 


Es indudable que entre los teóricos del aprendizaje sobre los que influyera Hull, 
Kenneth Spence fue su colaborador más cercano y su sucesor. Después de 
la muerte de Hull, Spence se constituyó en el líder indiscutido de la tradición de la 
teoría hulliana, aunque constantemente alteraba y modificaba algunas de sus par- 
tes significativas. Entre Spence y Hull existía una influencia recíproca. En reali- 
dad, Hull recibió mucho de Spence, y tomó sus ideas acerca del aprendizaje de dis- 
criminación, la transposición, el uso de variables intervinientes en la teorización; la 
noción de la motivación de incentivo, el gradiente derivado de reforzamiento y mu- 
chas otras hipótesis. Seguidamente expondremos a grandes rasgos algunas de las 
contribuciones de Spence. 


Teoría del aprendizaje de discriminación 

El trabajo inicial de Spence (1936) se refiere a una teoría del aprendizaje de dis- 
criminación, denominada teoría de la continuidad por las razones que veremos a 
continuación. En la situación de discriminación más simple, llamada del tipo “'ir-no 
ir”, el sujeto —por lo común un animal— es reforzado de modo positivo al res- 
ponder en presencia de un estímulo (llamado estímulo positivo) que se designa 
convencionalmente como E+), y no se le refuerza por responder en presencia de 
otro estímulo (el estímulo negativo, E—). Mediante entrenamiento diferencial, el 
sujeto termina por responder con prontitud al £+ pero no al E—, las variaciones 
en el estímulo controlan los cambios en su conducta: el sujeto discrimina. Una ver- 
sión un tanto distinta del experimento presente al E + y al E— simultáneamente, y 
el sujeto escoge entre los dos patrones de estímulo. El aprendizaje se revela cuan- 
do el sujeto elige infaliblemente £+ en tales ensayos de elección. 

En un artículo de 1936 Spence presentó lo que habría de convertirse en la con- 
cepción “clásica” o de “'continuidad tradicional” del aprendizaje de discrimina- 
ción, una concepción que sobrevivió a múltiples y estrictas pruebas y a numerosas 
críticas, y proporcionó un contraste para muchos desarrollos correlacionados en 
los estudios del aprendizaje de discriminación. El enfoque básico afirma que el aná- 
lisis del aprendizaje de discriminación no requeriría de nuevos conceptos, más allá 
de las nociones de condicionamiento simple, extinción y generalización de esti- 
mulo, Se supone que los efectos acumulativos de las respuestas reforzadas el esté 
mulo positivo integran una fuerte tendencia excitatoria en el E+. De modo similar, 
se creía que la inhibición condicionada se acumularía en el E— a partir de la frus- 
tración producida a consecuencia de las respuestas no reforzadas que se dieron en 
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presencia del £—. Se suponía que estas tendencias excitatorias e inhíbitorias esta- 
blecidas en £+ y en E— se generalizaban a estímulos semejantes, y que la gene- 
ralización disminuía conforme decrecía la similitud. La tendencia neta a responder 
a cualquier estímulo se da entonces mediante la excitación generalizada menos la 
inhibición generalizada a ese estímulo particular (véase la figura 5.6). Esta teoría 
simple ha demostrado ser muy útil y proporciona confiables explicaciones de mu- 
cho de lo que se sabe acerca del aprendizaje de discriminación (para un sumario 
véase G. A. Kimble, 1961). Con el correr de los años, sus deficiencias salieron 
lentamente a la superficie pero a menudo equivalen a estados incompletos más 
que a premisas incorrectas de la teoría. Una reseña de varios de estos defectos 
apareció en una edición anterior de este libro (1966, capítulo 15), de manera que 
no la repetiremos aquí, 


Transporición de la respuesta relacional 

Todos los enfoques teóricos del aprendizaje de discriminación comienzan con un 
intento de especificar, ya sea de modo formal o intuitivo, lo que un sujeto ha 
aprendido en su entrenamiento de discriminación. ¿Cómo caracterizaremos el co- 
nocimiento que el sujeto ha logrado mediante su procedimiento educativo? Para 
los conductistas, esta pregunta se traduce en otra acerca del control de estímulo 
de las respuestas: ¿cuál es el estímulo efectivo que controla la ejecución discri- 
minativa del sujeto? En un nivel de análisis, prácticamente todas las teorías con- 
testan a esta pregunta general de forma similar: la variable efectiva de estímulo 
que a la postre llega a controlar la ejecución discriminativa es aquella característica 
(indicio, atributo, etc.) o conjunto de características en E + ausentes (o distintas) 
en E-.. Estas características se denominan indicios relevantes porque sus varia- 
tianes se correlacionan con la presencia o ausencia del reforzamiento para respon- 
der, Los indicios que no se correlacionan así se llaman irrelevantes. 

Pero consideremos un problerna en el que Jos indicios relevantes consisten en 
diferentes valores a lo largo de un continuo de estímulo ordenado (como el tama- 
ño, la brillantez o el peso). Por ejemplo, supóngase que un mono está entrenado 
para usar el tamaño como indicio para conseguir una recompensa alimenticia. El 
arreglo puede consistir en la presentación simultánea de dos cajas entre las cuales 
el mono deba escoger; la que contiene la recompensa posee una tapa de 160 cen- 
tímetros cuadrados, mientras que la otra —que carece de recompensa— tiene una 
tapa más pequeña de 100 centímetros cuadrados. La teoría »elacional presupone 
que en esta situación el sujeto aprende la relación ““el área más grande es la co- 
rrecta”', La teoría absoluta supone que el sujeto ha aprendido conexiones espe- 
cíficas de estímulo-respuesta; en particular, que la respuesta de alcanzar está po- 
sitivamente condicionada al valor específico del estímulo recompensado (160), 
mientras que la respuesta se inhibe al valor del estímulo no recompensado (100). 

El mejor modo de descripción de ““lo que se aprende” es más que un asunto de 
gusto, ya que las pruebas de transferencia con estímulos nuevos nos proporcionan 
datos para inferir lo que el sujeto ha aprendido en la situación de 160 versus la de 
100. Si ha aprendido una relación (**escogió el más grande de los estímulos ””), en- 
tonces debe en cierto grado ser capaz de transfetir su respuesta a esta relación 
hacia nuevos pares de estímulo, que difieren de aquellos usados en el entrena- 
miento. En otras palabras; la relación que ha aprendido trasciende al par de estí- 
mulo específico utilizado para ejemplificar la relación. Así, si sometemos a prueba 
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Figura 5.6. Gradiente de generalización hipotética del hábito (curva continua) alre- 
dedor de 160 (+) e inhibición (curva punteada) alrededor de 100 (—). La diferencia, 
hábito menos inhibición, se indica numéricarnente en varios puntos. Los valores de 
estímulo están espaciados igualmente en una escala logarítmica (tomada de Spence, 
1942) 


al animal con el nuevo par de 256 centimetros versus el de 160, éste debería elegir 
el estímulo más grande del par; es decir, 256 en lugar de 160, a pesar de que 160 
era recompensado en la serie de entrenamientos previos. El resultado exper+ 
mental más común es que los animales sí escogen al estímulo 256 más que al estf- 
mulo 160. Dicho de otro modo, transponen la relación “más grande'* alo largo del 
continuo de estímulo. Á estos estudios se les denomina, por lo tanto, experimentos 
de transposición, 

Este tipo de transposición se ha descubierto con mucha regularidad en los expe- 
rimentos, y se le ofrece como evidencia de la concepción relacional de lo que el 
animal aprende (Kohler, 1913), Antes se creía que tal transposición era incor 
gruente con la teoría absoluta, ya que sobre esa base, ¿cómo podría predecirse 
que se escogería un nuevo estímulo (256 centímetros cuadrados) en vez de aquel 
(160 centímetros cuadrados) que se había recompensado con tanta frecuencia en 
el entrenamiento anterior? 

En este contexto Spence publicó otro artículo clásico en 1937, en el cual demos- 
traba que la transposición y diversos fenómenos relacionados son perfectamente 
predecibles desde una teoría absoluta del estímulo sobre lo que se aprende. Según 
Spence. todo lo que se necesita es la premisa de que los gradientes de generaliza- 
ción de la fuerza del hábito y de la inhibición alrededor de los valores específicos 
E+ y E- del entrenamiento tienen una cierta forma razonable. Este punto de vista 
se ilustra apropiadamente en la figura 5.6, en la cual se describe una concepción 
teórica de la situación establecida por el entrenamiento de discriminación de tamaño 
160 versus 100, La figura muestra un gradiente de hábito establecido alrededor 
del estimulo reforzado de entrenamiento (160), y un gradiente de inhibición esti- 
puladu en torno del estimulo no reforzado (100). La tendencia neta a responder a 
cualquier magnitud de estímulo se da por la diferencia entre el hábito generalizado 
y la inhibición en ese punto, En la figura 5.6 se indican estas puntuaciones de dife- 
rencia. En una prueba de elección entre dos estímulos, se escogerá aquel que ten- 
ga la tendencia neta de respuesta más grande, Por ejemplo, para el par de entre- 
namiento de 160 contra 100, la tendencia neta a responder a 160 es 51.7, y para 
100 es 29.7, de modo que en este par se escogerá el estímulo 160. 
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De esta teoría ““absoluta'” del estímulo se deriva un cierto número de implica- 
ciones. Predice la transposición en un pequeño rango de pares de estímulo cer- 
canos al par de entrenamiento; por ejemplo, a partir de la diferencia de puntuacio- 
nes que aparece en la figura 5.6, se esperaría que el animal escogiera el estímulo 
256 (que tiene una diferencia de puntuación de 72.1) más que el estímulo 160 
(cuya diferencia de puntuación es de 51.7). Así, se esperaría que un estímulo 
cercano a E + pero en el lado opuesto de £— sea en realidad más fuerte o más atracti- 
vo que el E + mismo. El examen de la figura 5.6 muestra también que la predicción 
acerca de la manera en que el animal escoge pares de estímulos en una prueba 
dada depende críticamente de lo lejos que se encuentre el par de entrenamiento. 
A medida que el par de prueba se mueve por encima y alejándose del par de entre- 
namiento, la teoría predice primero la transposición para los pares de prueba cer- 
canos, después la reversión de la transposición (escoger la más pequeña) para 
los pares de distancia intermedía (como en los 409 centímetros cuadrados contra los 
256), y después elecciones aleatorias para los pares de prueba muy alejados del 
par de entrenamiento (por ejemplo, en 900 centímetros cuadrados contra 1 300), 
De hecho, esta declinación se ha encontrado muchas veces en la transposición con 
l distancia, y constituye una dificultad para la concepción relacional. Además, 
según la teoría de Spence, no es necesario que E + y E- estén presentes simultá- 
neamente para la comparación a fin de establecer las condiciones que requiere la 
teoría para predecir Ja transposición en otras pruebas posteriores de este tipo. 

La presentación aislada del estímulo de E+ y £- con reforzamiento y no refor- 
zamiento de la respuesta debería servir convenientemente para producir eleccio- 
nes de transposición posteriores sobre las pruebas pareadas. La transposición se 
encuentra después de tal entrenamiento de un solo estímulo, aunque por lo gene- 
ral varios cambios de procedimiento hacen que ésta sea un tanto menor que aque- 
lla que sigue a la discriminación de la presentación simultánea. De la teoría de 
Spence se infieren algunas otras predicciones. Por ejemplo, la extensión de es- 
tímulo de prueba sobre la cual se observa la transposición debería ser menor cuan- 
do E- está incluso por debajo del E+ del entrenamiento. En general, los efectos 
que la pronosticaba la teoría de Spence se han confirmado en los experimentos. 
Un estudio de Honig (1962) muestra con claridad varios de estos efectos dentro 
de un solo experimento. 

AJ Devar las cosas un poco más lejos, Spence (1942) Apis su teoría para cubrir 
casos que implicaban tres estímulos de entrenamiento. En el problema del tamaño 
intermedio, se entrenaría al animal para escoger el estímulo 160 entre la tríada 
consistente en 100, 160 y 256 centímetros cuadrados. En la figura 5.7 se describe 
el análisis de Spence en términos de su teoría de estírmulo específico, Se establece 
un gradiente de inhibición en torno de ambos estímulos no reforzados, y los dos 
gradientes se suman en puntos donde se superponen. En este diagrama son evi- 
dentes diversas implicaciones. Primero, el problema del tamaño intermedio de- 
bería ser mucho más difícil de aprender que el de dos elecciones. Esto se observa 
al comparar la figura 5.7 con la 5.6, y notar que la tendencia de la reacción neta di- 
ferencial a E+ es mucho menor para la tarea de tamaño intermedio. Segundo, el 
aprender a escoger el estímulo intermedio tendría que ser mucho más difícil 
que aprender a elegir cualquiera de los tres estírmulos finales (el más largo o el más pe- 
queño), Esto es verdad y se deduce con facilidad, aunque no aparezca en la figura 
5.7. Tercero, no debería haber ninguna transposición después del entrenamien- 
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Figura 5.7. Gradientes hipotéticos a continuación del aprendizaje del problema de 
tamaño medio, donde 160 se recompensaban, y 100 y 256 no se recompensaban, Los 
gradientes de inhibición (curvas punteadas) alrededor de 100 están sumados para pro- 
ducir una sola curva de inhibición neta con un pico en 160. la diferencia, hábilo me- 
nos inhibición neta, se indica numéricamente en varios puntos (tomada de Spence. 
1942). 


to en el problema del tamaño medio, pero debería existir después del entrenamiento 
en uno de los estímulos finales de la tríada. Por ejemplo, en la figura 5.7, a comti- 
nuación del entrenamiento en el estímulo de tamaño medio, una prueba con la tría- 
da 160, 256 y 409 debería conducir a la elección de 160, el estímulo positivo espe- 
cífico del entrenamiento. De hecho, para cualquier tríada de prueba, el estímulo 
preferido tendría que ser uno más cercano en tamaño a 160. Spence (1942) pre- 
sentó datos que demostraban que sus sujetos (chimpancés) no transponían la rela- 
ción de tamaño medio a la tríada de prueba (160, 256, 409) a continuación del en- 
trenamiento en 100, 160 y 256. 

A pesar de la atractiva parsimonia de la teoría de Spence y de la evidencia que 
se aduce en su favor, han aparecido otros resultados que sugieren que es de cierta 
manera incompleta o inadecuada. Algunos de estos estudios, camo los de los €. 
B. Smith (1956) y Riley (1958), recalcan, al menos para el continuo de la 
brillantez, la importancia de la estimulación contextual del fondo que rodea a las 
manchas del estímulo focal a las cuales el sujeto responde. Así, en la prueba de 
una mancha con una brillantez particular ésta puede verse más brillante o más os- 
cura dependiendo de si el fondo que la rodea es más oscuro o brillante, respec- 
tivamente, que la mancha de prueba. Por ejemplo, Riley demostró que la dismi- 
nución en transposición en las “pruebas lejanas'* no se producía si la razón entre 
la mancha de prueba y la brillantez que la rodeaba $e mantenía igual en el entre- 
namiento y en la prueba, aunque se cambiaran los niveles de intensidad absoluta. 
Además, en varios experimentos de seguimiento acerca del problema del tamaño 
medio, a menudo se encontraba la transposición (contrariamente al resultado de 
Spence), aunque no en todos los casos. 

Zeiler (1963) propuso una teoría más completa de la transposición, la que presu- 
ponía que el sujeto percibe cada estímulo en relación con una norma interna o nivel 
de adaptación (NA), un concepto creado por Helson (1964). El (NA) constituiría 
un valor promedio de los estímulos experimentados a lo largo del continuo de inte- 
rés, algo asícomo una magnitud. Se cree que el sujeto aprende a seleccionar aquel 
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estímulo (positivo) que mantiene una cierta proporción con el (NA) actual. Al 
suponer que el (NA) cambia de acuerdo con el conjunto de estímulos de prueba, 
Zeiler demuestra la forma en que esta teoría explica muchos de los resultados 
sobre la transferencia a continuación de problernas de dos y tres estímulos. 

Como a menudo sucede en la evolución de las explicaciones científicas, las 
hipótesis alternativas iniciales (relacional versus absoluta) a la postre resultan in- 
adecuadas o incompletas. La siguiente explicación, que emerge dialécticamente, 
implica varios conceptos novedosos, pero también mantiene algunas de las carac- 
terísticas de las teorías anteriores. El fenómeno de la transposición engendró una 
controversia sólo en lo que respecta al comportamiento de los animales, y quizá el 
de los niños preverbales, El mismo Spence restringía la aplicación de su teoría a 
organismos no verbales, pues creía que el uso humano del lenguaje simbólico in- 
troduce nuevos factores que su teoría no cubre, Sin duda alguna, los seres huma- 
nos aprenden y utilizan conceptos relacionales en abundancia, y nuestro lenguaje 
está lleno de términos relacionales o comparativos que usamos apropiadamente 
cientos de veces al día (más grande, encima, más lejos, al oeste de, etc.). Algunos 
investigadores se han interesado por la manera en que la respuesta de transposi- 
ción varía a medida que el infante humano se desarrolla y se vuelve más diestro en 
el uso del lenguaje. La tendencía general de los resultados es que la transposición 
mejora con la edad mental y/o con la destreza lingúística del niño, aunque algunos 
informes discrepan en este punto (para una reseña, véase Hebert y Krantz, 
1965), 


Teoría de la continuidad 

Un aspecto digno de mención es la manera en que Spence (en su artículo de 
1936) trata al aprendizaje de discriminación en lo que respecta a los compuestos o 
haces de indicios de estímulo. La tarea típica de discriminación implica patrones de 
estimulo de multiatributo o multidimensionales. Por ejemplo, en una tarea de dis- 
criminación simultánea típica, en un ensayo particular se le podría exigir a un muno 
que escogiera entre “un gran triángulo blanco a la izquierda”” versus **un cua- 
drado negro pequeño a la derecha'*. Por costumbre, por grande y pequeño se en- 
tienden los valores de la dimensión del tamaño. En esta ilustración, hay cuatro di- 
mensiones binarias (de dos valores), de modo que hay 2* = 16 posibles patrones 
de estímulo (y 8 pares complementarios). El experimentador selecciona como co- 
rrecto al valor de una de las dimensiones (por ejemplo, un triángulo), de manera 
que se recompensará la elección de cualquier patrón que posea tal valor. Si el 
triángulo fuera correcto, entonces a la forma se le llamaría dimensión relevante, 
mientras que el tamaño, el color y la posición serían las dimensiones irrelevantes, 
Los diversos valores de las dimensiones irrelevantes suelen parearse con la mis- 
ma frecuencia con el valor reforzado, así como con el no reforzado. Por ejemplo, 
el triángulo está a la izquierda en la mitad de los ensayos, y el cuadrado está a la iz- 
quierda en la otra mitad. Con tales arreglos, la elección consistente de un valor 
ivrelevante (por ejemplo, izquierda) resultaría en recompensa en la mitad de los 
ensayos, y en la otra en no recompensa. 

Con estas consideraciones como marco de referencia para el tema, podemos esti- 
pular la naturaleza de las reglas del aprendizaje y la composición, de Spence. En tér- 
minos generales, este investigador presuponía que a cualquier valor de un patrón 
de estímulo se le podría asignar una tendencia de reacción neta de acercamiento 
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(sus tendencias excitatorias menos inhibitorias), y la tendencia total a acercarse a 
un patrón dado se calculaba metiante la suma algebraica de las tendencias de reac- 
ción de los valores componentes que lo forman. Cuando el sujeto debía escoger 
entre dos patrones (haces de hábitos), se espera que elija aquel con el mayor po- 
tencial de reacción agregada. Otra premisa es que, a continuación de la respuesta 
a un patrón con recompensa o no recompensa consecuente, al final de cada ensayo 
las tendencias de reacción de cada uno de los componentes del patrón elegido se 
incrementa apropiadamente (si es un ensayo recompensado), o disminuyen (si no 
es recompensado). Así, el sujeto fundamenta su elección en todos los componen: 
tes percibidos del estímulo elegido, y aprende (altera las fuerzas netas del hábito) 
en lo que se refiere a la totalidad de dichos componentes. Además, se suponía que 
los cambios en las tendencias de hábito para indicios particulares ocurren gradual 
mente, mediante la acumulación continua de incrementos y decrementos debidos 
a las recompensas y a las no recompensas. Esta peculiaridad es la que le dio el t£ 
tulo de teoría de la continuidad. 

De acuerdo con esta concepción, por ejemplo, un sujeto podía comenzar con un 
conjunto de preferencias habituales que resultan ser indicios irrelevantes en el 
problema de discriminación, de modo que una rata puede mostrar preferencias 
sistemáticas de posición en un laberinto, antes de que los efectos automáticos de 
la recompensa diferencial modelen gradualmente su respuesta al control del inde 
cio relevante (por ejemplo, la brillantez de los lados del laberinto). Según está teo- 
ría, las tendencias de acercamiento diferencial se acumulan a los valores positivos 
versus los negativos dentro de la dimensión relevante, mientras que las tenden- 
cias de acercamiento á lus dos valores dentro de dimensiones irrelevantes tienden 
a emparejarse gradualmente (pero con una variabilidad en las fuerzas de ensayo a 
ensayo debida a recorridos favorables o desfavorables de correlaciones recom- 
pensadas con el valor positivo). El animal responde sin errores cuando el diferen- 
cial de hábito que favorece al valor positivo más que al negativo es lo bastante 
grande como para compensar cualquiera y todas las combinaciones de diferencia 
les de hábito de los indicios irrelevantes; es decir, el hábito total agregado para 
cualquier patrón positivo (haz) excede al háhito total agregado de su patrón negate 
vo (opuesto), complementario. 

Estos conjuntos de premisas (acerca de la determinación compuesta de la elec- 
ción, y del aprendizaje gradual en lo que toca a todos los componentes percibidos) 
constituyen el núcleo de la teoría de la continuidad. Los oponentes de Spence ne- 
gaban casi todas estas premisas, como es el caso de Krechevsky, Lashley o Tol: 
man, que abrazaban un tipo de teoría de comprobación de hipótesis del aprendizaje 
de discriminación. Los detalles de esta última teoría, en especial el trabajo de 
Levine acerca del aprendizaje humano de discriminación, se examinarán en el capí- 
tulo 11 en ocasión de referirnos a Tolman. Las premisas clave de la teoría de com- 
probación de hipótesis son las siguientes: 


1. La respuesta del sujeto en un ensayo dado se basa sólo en una (o al menos en muy 
pocas) caracteristica del patrón total, El sujeto “atiende selectivamente” sólo a esa ca- 
racterística del patrón. 

2. El resultado recampensante o no recompensante en ese ensayo hace que el sujeto 
aprenda fundamentalmente sólo acerca de aquel indicio (hipótesis) que dominaba su elec- 
ción en ese ensayo. De manera primordial, el resultado actúa como información que per- 
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mite la confirmación o refutación de una conjetura (hipótesis) acerca de la solución correc- 
ta de la tarea de discriminación. 

3. La solución tiende a ocurrir de pronto, ''en completo discerramienta”*, de una forma 
de todo o nada, en vez de la acumulación gradual de la fuerza. 


Existen distintas versiones de tales teorías de la continuidad, que varían 
de acuerdo con sus reglas para alterar el proceso “de atención”” y el proceso de 
“aprendizaje E-R””. Hay una muy larga y productiva historia de investigación 
acerca de los detalles de las formulaciones de dichas teorías de discriminación. 
Disponemos de sumarios parciales de la bibliografía relacionada con el tema 
en Sutherland y Mackintosh (1971), y en Trabasso y Bower (1968). La teorización 
de Spence tiene la ventaja de que su formulación clásica (y su argumentación ex- 
perimental) fueron de suma importancia durante muchos años dentro del análisis 
del aprendizaje de discriminación. Pocas teorías de los subfenómenos específicos 
en psicología probaron ser tan poderosas y viables a la luz de las investigaciones 
posteriores. 


Motivación del incentivo 

Otra área en la cual Spence influyó significativamente sobre la teoría de Hull fue 
enla concepción de las acciones de las recompensas y las no recompensas sobre la 
conducta instrumental. En 1943 Hull suponía que la fuerza del hábito, el principal 
factor asociativo en la teoría, era afectado por las condiciones del reforzamiento. 
Sin embargo, Spence había argumentado que la recompensa debería concebirse 
en el sentido de que tiene un efecto motivador o energizante sobre los habitos, en 
lugar de afectar directamente al mismo factor de asociación. De hecho, en la for- 
mulación de Spence (1956, 19604) se presumía que la fuerza del hábito era una 
función del número de contigiidades E-R (ensayos), mientras las condiciones de 
recompensa (magnitud de la recompensa y número de ensayos recompensados) 
afectaban al potencial de reacción a través de un factor motivacional de incentivo, 
K. Se pensaba también que la motivación de incentivo se combinaba y se sumaba a 
impulso D, para integrar el complejo motivacional total que multiplica a la fuerza 
del hábito. Así, omitiendo los subindices: 


Hul:E=HxDxK-1 
Spence: E = Hx(D+K)-—1 


Estas diferentes reglas de combinación para D y K conducen a predicciones un 
tanto distintas. Sin embargo, sólo podemos optar por una u otra en conjunción con 
una teoría poderosa acerca de la manera de medir el potencial de reacción; las di- 
ferentes mediciones de E, como la velocidad de la respuesta, la resistencia a la ex- 
tinción y la elección preferencial, producen distintas respuestas a la pregunta so- 
bre cómo se combinan D y K. Este punto aún permanece sin resolver, 

Spence fue el primer teórico que promovió la idea de relacionar el constructo de 
motivación de incentivo K, con la fuerza de la respuesta meta anticipatoria fraccio- 
naria (+¿-S¿). A la », se le consideraba como una respuesta condicionada clásica 
que se mueve hacia adelante en la cadena instrumental. Se presumía que su ocu- 
rrencia temprana en la cadena canalizaba la excitación hacia la ejecución de la res- 
puesta. Este análisis parece plausible, ya que las variables que afectan la amplitud 
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de la +,, (por ejemplo, la cantidad o la calidad de la recompensa), o que extienden el 
condicionamiento r, (por ejemplo, número de ensayos, demora o probabilidad de 
la respuesta) supuestamente también tienen los efectos correspondientes sobre el 
constructo teórico K. Como se indicó en el capítulo 4, el procedimiento es similar 
a la manera en que Sheffield y Estes relacionan las recompensas con la ejecución 
de las respuestas instrumentales. 

Esta identificación entre la amplitud del », y la motivación de incentivo produjo 
un gran desencanto. Logan (1968) presenta un resumen de los argumentos al res- 
pecto. Por un lado, necesitamos de algo como la “motivación de incentivo'” para 
explicar Ja forma en que los animales corren para escapar de la descarga (véase, 
por ejemplo, G. H. Bower, 1960), pero en tales casos es difícil imaginar que es la 
respuesta meta condicionada clásicamente cuya anticipación es *“excitante””. Otro 
argumento presenta literalmente la conjetura de que la 7, es una respuesta perifé- 
rica, y entonces demuestra que los intentos directos para manipular la y; de 
comida al usar drogas que facilitan o inhíben la salivación no ha tenido el efecto es- 
perado sobre la ejecución de los hábitos recompensados por alimento (véase 
Lewis y Kent, 1931). 

Wilbams (1965) registró la salivación en perros que habían aprendido a presionar 
un panel para obtener alimento en un programa de intervalo fijo, donde se reforzaba 
la primera presión del panel después de que había transcurrido un intervalo dado. 
Williams descubrió que la presión instrumental del panel ocurría mucho tiempo an- 
tes de que se iniciara la salivación, y que los dos sistemas de respuesta no se co- 
rrelacionaban adecuadamente en el transcurso del tiempo dentro de un ensayo. 
Entonces, ¿qué es lo que proporciona la motivación de incentivo para las primeras 
presiones del panel antes de que comience la salivación? Ellison y Konorski (1964) 
observaron una disociación similar entre la presión del panel y la salivación: a 
una primera señal, los perros presionaban varias veces un panel a in de producir una 
segunda señal, que era seguida (sin más presiones) por alimento varios segundos 
después. Observaron que a la primera señal los perros presionaban pero no saliva- 
ban; o la segunda salivaban pero no presionaban. Tales resultados indican que la sa- 
livación (un Índice de r,¿-S¿), aunque esté correlacionada con la entrega inminente 
de la recompensa alimenticia, carece de una conexión vital con la respuesta instru- 
mental. De hecho, por intuición parece que la actividad instrumental debería ser 
más adaptable cuando saca al animal de una situación donde no espera recompensa 
y lo lleva a una en la que sí la espera. 

Hull y Spence concibieron a K' como una motivación de incentivo generalizada 
que energiza a todos los hábitos (véase la ecuación anterior). Sin embargo, al pa- 
recer no se gana mucho al agregar la noción de motivación generalizada a la idea 
hásica de que los organismos pueden asociar recompensas distintas con los estí- 
mulos o respuestas que las anteceden. En varios experimentos se ha dernostrado, 
contrariamente a la teoría de la motivación, que la respuesta instrumental para el 
alimento por lo general disminuye si se introduce un EC pavloviano para comida 
durante la ocurrencia de la respuesta instrumental; la alteración es más probable 
cuando la respuesta necesaria para Obtener comida es incompatible con la res- 
puesta instrumental (LoLordo et al., 1974). En un experimento crítico dirigido por 
Trapold (1962) se estudió el acrecentamiento del reflejo de sobresalto al oír un dispa- 
ro de arma de fuego, como una medición de la motivación generalizada, ya que en 
trabajos anteriores de Brown, Kalish y Farber (1951) se había demostrado que el 
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reflejo de sobresalto se incrementaba en presencia de un £C pavloviano, que pro- 
vocaba miedo debido a los pareamientos con la descarga eléctrica. Desafortunada- 
mente, Trapold descubrió que un EC pavloviano para comida no sólo no producía 
ningún aumento del reflejo de sobresalto, sino que de hecho lo hacía disminuir, 
contrariando la idea general de que la expectativa de alimento es motivadora. 

Una explicación más plausible de estos resultados es que los animales aprenden 
a esperar reforzadores especificos para estímulos específicos, y que tales expec- 
tativas sirven fundamentalmente como guía para seleccionar las respuestas; es 
decir, la 7¿-S, tiene un papel más importante en la selección de la respuesta que 
para proporcionar motivación. Trapold (1970) informó de un interesante experi- 
mento relacionado con este punto, en el cual se demostró la especificidad de refor- 
zador del supuesto mecanismo », +S,. Las ratas debían presionar una palanca en 
presencia de un tono para recibir como recompensa una bolita de comida, y una 
palanca distinta en presencia de un sonido de clic para recibir una recompensa de 
agua azucarada (véase la figura 5.8). Esta discriminación instrumental avanzaba 
con mayor rapidez si antes del entrenamiento de palanca los animales habían reci- 
bido parearnientos pavlovianos del tono con la bolita de comida, y del clíc con la sa- 
carosa; la discriminación instrumental se aprendía con más lentitud si se habían in- 
yertido los pareamientos pavlovianos iniciales con el tono-sacarosa y el clic-comi- 
da. Tales resultados sugieren que los estímulos se convierten en señales para sus 
recompensas asociadas específicas, y que las distintas expectativas ayudan a dife- 
renciar el tono del clic. El diagrama asociativo se muestra en la figura 5.8 para el 
caso en que los pareamientos EC pavloviano-reforzador son consistentes con 
aquellos que operan en el entrenamiento de discriminación instrumental, 

Los diversos resultados reseñados no confirman la idea de que las recompensas 
esperadas instigan un estado motivacional generalizado. Además, la expectativa 
de recompensa debe ser específica para combinaciones específicas de estímulo y 
respuesta. Sin embargo, esto no nos obliga a aceptar la concepción de que los ani- 
males inician respuestas sólo después de que han explorado las respuestas y ge- 
nerado alguna expectativa de recompensa para cada una de ellas. Anteriormente 
presentamos argumentos contra la respuesta de exploración de la teoría' del hábito 
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de Mowrer; una teoría que se basa en la retroalimentación de las respuestas 
iniciadas de modo incipiente para proporcionar motivación o inhibición para esa 
respuesta, no permite que la motivación de incentivo opere en el momento de la 
elección. Por ejemplo, supóngase que una rata ha tenido experiencia con un labe- 
fínto de (para ser absurdo) 100 pasadizos discriminablemente diversos que parten 
de un punto de elección, cada uno asociado con recompensas O demoras de magni- 

tud ligeramente diferentes. Al presuponer una experiencia igual con todos los pa- 
sadizos (de modo que los H sean iguales), la teoria 7¿ nos haría creer que la rata 
puede hacer su elección sólo al orientarse a todos los pasadizos en turno, obtener 
una lectura particular del 7, para cada uno de ellos almacenar esa lectura, retener 
la respuesta hasta que todas se hayan explorado, comparar las *lecturas r¿” y, 
por último, decidirse por aquella respuesta con la lectura más alta. Pero esto no 
parece plausible. Si los laberintos de 100 elecciones parecen al lector demasiado 
absurdos, deberá recordar que en cada momento a lo largo de la ejecución de una 
cadena de respuesta, puede concebirse que el organismo escoge entre un vasto 
repertorio de posibles respuestas. Por ejemplo, la teoría micromolar de Logan 
(1960), que examinaremos más adelante, presupone que incluso para la respuesta 
cualitativa más simple el animal selecciona las características intensivas de la mis- 
ma: su velocidad, amplitud y fortaleza. Como afirmaba Logan (1968, pág. 8): 
“parece improbable que algún organismo tenga el tiempo o los recursos para to- 
mar decisiones momentáneas con base en el monitoreo implícito de todos los posi- 
bles cursos de acción”'. Y luego concluye: *““En la actualidad, parece preferible 
concebir a la motivación de incentivo como específica para diferentes sucesos E-R 
y entregada de inmediato como una base para la elección anfes de que ésta se lleye 
acabo” (pág. 8). 

Según Logan, la motivación de incentivo es específica de sucesos particulares 
E-R y constituye un determinante primordial de la selección de la respuesta. Lo- 
gan (1969) supone que la motivación de incentivo es graduable en sentido ascen- 
dente o descendente de acuerdo con las acciones conjuntas de las recompensas y 
los castigos. Las recompensas tienen un valor de incentivo positivo, y los castigos 
de incentivo negativo, y el incentivo neto de una respuesta dada depende de la di 
ferencia entre los factores positivo y negativo. Los Jectores familiarizados con la 
teoría económica o del valor en la filosofía notarán que Logan usa aquí la motiva- 
ción de incentivo de una forma muy similar al concepto de la utilidad subjetiva en 
esas disciplinas. En realidad, esto no es accidental, ya que Logan desea que la teo- 
ría acerca de la toma de decisiones o la selección de la respuesta en los organis- 
mos inferiores (véase Logan, 1965) sea congruente con la manera en que concebi- 
mos la toma de decisiones en los seres humanos inteligentes; y la teoría de ka uti- 
lidad se desarrolló para explicar (o prescribir normativamente) las elecciones de 
los hombres “'racionales”. 


Abram Amsel 


Discípulo de Spence, Abram Amsel es un importante investigador contempo- 
ráneo dentro de la tradición hulliana que ha concentrado sus esfuerzos en el aná- 
lisis de la no recompensa y la extinción de la conducta instrumental. Las interpre- 
taciones anteriores de la no recompensa habían asignado a ésta un papel esencial- 
mente pasivo. Por ejemplo, Tolman suponia que la no recompensa servía sólo 
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para desconfirmar y debilitar la expectativa de recompensa que un animal tenía. 
En la temprana teoría de Hull se postulaba que los ensayos no recompensados 
permitían la acumulación de los factores inhibitorios sin ser desequilibrados por un 
incremento correspondiente en A o en K. Como contraste con este papel pasivo 
de la no recompensa, la hipótesis de la frustración de Amsel concibe a la no recom- 
pensa de una respuesta previamente recompensada como un suceso activamente 
ptnitivo y aversivo. Por lo tanto, muchos de los efectos de la no recompensa 
sobre la respuesta se consideran análogos a los efectos que el castigo produce 
sobre la misma conducta. 

En numerosos artículos (por ejemplo, 1958, 1962, 1967), Amse! ha desarrollado 
sus hipótesis y argumentado convincentemente en favor de ellas; las más signi- 
ficativas contribuciones adicionales se deben a Wagner (1963, 1966) y a Spence 
(19604). En primer término transcribiremos la hipótesis y luego reseñaremos los 
tipos de experimentos que la apoyan. La hipótesis es la siguiente: 


La ocurrencia de una no recompensa en el momento en que el sujeto espera una recom- 
pensa origina una reacción de frustración primaria (R y). La estimulación retroalimentado- 
ra de esta reacción es aversiva y tiene efectos motivacionales persistentes a corto plazo 
sobre la conducta instrumental subsecuente. Las partes fraccionarias de esta reacción de 
frustración primaria se condicionan de la manera clásica a los estímulos que preceden a su 
provocación. La ocurrencia de esta respuesta fraccionaria de forma anticipatoria se desig- 
pa con 7 Sp. Los indicios Sp dela irustración anticipatoria se asocian principalmente con 
las respuestas de evitación, pero estas cunexiones pueden modificarse mediante el en- 
trenamiento. 


Dentro del sistema hulliano, la frase “espera una recompensa”” se traduce en 
enunciados acerca del 7, su mecanismo para la representación de la recompensa 
anticipatoria. Recuérdese que el », es una variable aprendida que difiere en su am- 
plitud con los ensayos y con las características de la recompensa (su cantidad, su 
dulzura, etc.) 

El supuesto efecto motivacional de la no recompensa frustrante puede obser- 
varse en la intensificación o aceleración de las respuestas que se produce unos 
cuantos segundos después de que e? animal experimenta el no reforzamiento. La 
situación estándar para estudiar el fenómeno consiste en una senda de dos cone- 
xiones. Se entrena a la rata para que corra hacia una primera caja meta a fin de ob- 
tener una recompensa; después de permanecer unos cuantos segundos allí, se 
abre la entrada hacia una segunda senda, que el animal recorre para conseguir una 
segunda recompensa. Luego del entrenamiento en esta secuencia de dos conexio- 
nes, la omisión de la primera recompensa produce un momentáneo incremento en 
la velocidad al correr posteriormente por la segunda senda, en el mismo ensayo. 
La diferencia en las velocidades de carrera en la segunda senda a continuación de 
la no recompensa versus la recompensa en la primera caja meta se toma como un 
índice de la magnitud de! efecto de frustración (EF). Como lo pronosticaría la teo- 
ría de Amsel, los factores que influyen sobre la magnitud del EF tienden a ser 
aquellos que provocarían una mayor excitación del r¿ en la primera conexión de 
la senda. Es decir, cuanto mayor sea la expectativa de recompensa, mayor será la 
frustración producida por la no recompensa. Un resultado particularmente impor- 
tante es que, con el 50% de ensayos recompensados y no recompensados en la 
primera caja meta, el EF no aparece durante los ensayos iniciales sino que se 
desarrolla de mado gradual con el entrenamiento, lo cual quizá refleje el condicio- 
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namiento ulterior de la recompensa anticipatoria. Un segundo resultado importan- 
te (Amsel v Ward, 1965) es que el EF para la no recompensa en la primera caja 
meta disminuye y finalmente desaparece si se proporcionan indicios discriminati- 
vos en la primera senda (por ejemplo, es negra o blanca), que predicen recomper- 
sa o no recompensa en la primera caja meta. Así, si no se espera ninguna recom- 
pensa, la no recompensa ya no es frustrante. Tercero, se afirmaba que el EF 
ocurre cuando la cantidad de la recompensa se reduce sólo a un nivel inferior (no 
cero), y la magnitud del EF se dosifica de acuerdo con reducciones graduadas en 
la recompensa de prueba, por debajo de la cantidad que solía esperarse (G. H. 
Bower, 1962c). Sin embargo, otra evidencia (Barret ef a!., 1965) parece indicar 
que estos efectos graduados se confunden con los efectos depresivos temporales 
sobre la velocidad de carrera de la rata, relacionada con que ésta haya comido más 
o menos alimento en la primera caja meta. 

Wagner (1963) presenta datos que apoyan la premisa de que la frustración pue- 
de ser condicionada y que actúa como un estímulo-impulso aversivo. Las ratas co- 
rían por una senda; la mitad de los ensayos se recompensaba y la otra mitad no, 
en un orden aleatorio. Se presentaba el sonido de un timbre exactamente un mo- 
mento antes de que los animales miraran hacia el comedero vacío en los etr 
sayos no recompensados. Se creía que este procedimiento asociaría al timbre 
con la reacción de frustración provocada cuando la rata miraba al comedero vacío. 
Más adelante se demostró que el timbre acrecentaba el reflejo de sobresalto a un 
disparo de arma de fuego, una medición que probó ser sensible a los efectos moti- 
vacionales adquiridos de los indicios. Asimismo, el timbre podía emplearse de 
modo efectivo para entrenar y mantener una respuesta que producía escape del 
timbre. La interpretación es que la respuesta de escape se refuerza porque termi- 
na con el timbre, el cual está asociado con. la frustración agresiva. Las investiga- 
ciones de Daly (1969, 1970, 1974) demuestran formas particularmente efectivas 
de aprendizaje supuestamente reforzadas por la “reducción de la frustración”, 

Se supone que la frustración aplicada a la extinción de las respuestas instrumen- 
tales recompensadas actúa como un castigo. Como la extinción implica la frustra- 
ción repetida en la meta, el animal termina por esperar la frustración (el meca- 
nismo 7,-S;), así como aguardaría con temor una descarga eléctrica dolorosa en la 
meta. La frustración anticipatoria produce inicialmente la evitación de la meta. al 
evocar respuestas que interfieren con el acercamiento continuado al lugar donde 
ocurre la frustración. Sin embargo, se argumenta que el reforzamiento parcial en- 
trena eficazmente al anima) para tolerar la frustración. En particular, las circuns- 
tancias de tal entrenamiento dan lugar a que los indicios S, se conecten con el 
acercamiento más que con la evitación. Así, se supone que la extinción es más len- 
ta a raíz de entrenamiento de reforzamiento parcial, porque el mismo hábito de 
acercamiento ha adquirido temporalmente los medios normales para la excitación 
de respuestas de interferencia (evitación). 

Esta hipótesis acerca de la extinción y el reforzamiento parcial ha recibido consi» 
derable apoyo experimental. Hay pocas dudas de que las condiciones en las cuales 
ocurre la extinción y sus estímulos asociados son aversivas, y que el animal es re- 
forzado al escapar. Por ejemplo, en una caja de Skinner los animales aprenderán 
una respuesta nueva para retirar un estímulo que se ha asociado con la extinción. 
Azrin (1964) demostró, además, que durante la extinción de una respuesta refor- 
zada con comida, las palomas aprenden una respuesta nueva para k cual la recom- 
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pensa es una breve oportunidad de agredir a otra paloma. En condiciones de con- 
trol neutral esa agresión no ocurre. La importancia que reviste esta observación 
para la hipótesis de la frustración es que se sabe que tales respuestas agresivas 
son sumamente probables, en particular cuando el pájaro está en circunstancias 
dolorosas o incómodas. Estos resultados se explican al presuponer que las res- 
puestas no reforzadas producen frustración, y que ésta es aversiva, 

Otro hecho relacionado es que las drogas tranquilizantes, que supuestamente 
reducen las consecuencias emocionales de la frustración, retardan su extinción y 
además liberan en parte una respuesta que la frustración inhibía anteriormente. 
Par otro lado, Wagner (1966) ha demostrado grandes transferencias entre los ani- 
males entrenados para resistirse al estrés del castigo (descarga eléctrica) y los 
que se entrenan a fin de que resistan la frustración para aproximarse a una meta. 
En particular, si a las ratas se les ha entrenado para que sigan acercándose a una 
caja recompensa, a pesar del castigo, el número de ensayos requeridos para alcan- 
zar la extinción es mayor cuando se detienen la comida y el castigo. Asimismo, los 
animales entrenados con reforzamiento parcial continúan respondiendo durante 
más tiempo una vez que el castigo se introduce en la meta. Estos resultados su- 
gieren que la descarga eléctrica y la no recompensa tienen propiedades comunes, 
de modo que el aprendizaje para resistirse a una de ellas se transfiere en cierto 
grado a la otra. Y este hecho apoya la interpretación de que la no recompensa es 
un suceso frustrante y aversivo. 

Los estudios citados y algunos otros parecen proporcionar evidencia conclu» 
yente de que la no recompensa (cuando se espera la recompensa) tiene un efecto 
aversivo muy semejante al de un castigo. Sin embargo, la aceptación de esa pro- 
posición no implica lógicamente la creencia en la teoría particular de la interferen- 
cia de la extinción que propone Ámsel. Tal teoría afirma que la anticipación de la 
frustración en la meta se conecta inicialmente con la evitación de la meta (provoca 
respuestas que interfieren con el movimiento dirigido a la meta); al exponer las 
circunstancias de tal modo que al sujeto se le induzca a seguir corriendo bajo en- 
trenamiento de reforzamiento parcial, los indicios de la frustración anticipatoria se 
asocian con el acercamiento a la meta más que con su evitación. 

Una de las demostraciones más convincentes de que el r,-S, puede establecer 
asociaciones con respuestas manifiestas surgió de un experimento que Roos 
(1964) realizara en el laboratorio de Amsel. En el cuadro 5.1 se describe el diseño 
del experimento. Durante la fase 1 se entrenó a seis grupos de ratas en una caja 
corta, negra y amplia con reforzamiento continuo (100 %) o parcial (50 %) usando 
una de tres respuestas: correr, saltar un agujero en el piso, o trepar por una pared 
de alambre hasta llegar al comedero. Estas tres respuestas se seleccionaron me- 
diante pruebas anteriores para que tuvieran una dificultad similar, y los animales 
las aprendieron casi a la misma velocidad. La idea esencial es que durante este en- 
trenamiento de la fase 1, los grupos de reforzamiento parcial presumiblemente 
condicionan su frustración anticipatoria 7,-S, a su respuesta de acercamiento, ya 
se trate de correr, saltar o trepar. Esta suposición se comprueba en la fase 3 del 
experimento. 

En la fase 2 se llevó a los animales —que operaban bajo la sed para recompensas 
de agua (en vez del hambre)— a un nuevo aparato, y se les entrenó con el reforza- 
miento continuo en una respuesta de correr. Se trataba de configurar una situa- 
ción muy distinta de la correspondiente a la fase 1, de manera que la transferencia 
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CUADRO 5.1. Boceto del experimento de Ross (1964) 
[tomado de Amsel, 1967). 


m (2) (6) 


Fases del Aprendizaje Adquisición de la Extinción de la 
experimento preliminar respuesta de correr respuesta de correr 
(a) Caja corta, (b] Pasadizo fargo, (b) 
Aparato negra y ancha bianco y estrecho 
Motivación Hambre Sed Sed 
Correr 
Continuo (CC) 
Parcial (CP) 
Condiciones Saltar Correr Correr 
experimentales Continuo ($C) Recompensa No recompensa 
Parcial (SP) continua continua 
Trepas 


Continuo (TC) 
Parcial (TP) 


diferencial en la fase 3 pudiera surgir discutiblemente de la similitud de estímulo 
interna (mediada) en vez de la externa. 

La tercera, es la fase crítica; en ella se extinguía la respuesta aprendida en la 
fase 2, La pregunta se refiere a la forma en que los diversos grupos se clasificarán 
por grados en la extinción. Los datos aparecen en la figura 5.9, en la cual se rela- 
ciona la velocidad media de carrera del grupo para las seis condiciones del último 
bloque de ensayos de adquisición, y durante 32 (3 bloques de 4) ensayos de extin- 
ción. La teoría de Amsel predice que durante la fase 3 de extinción los animales se 
frustrarían y comenzarían a experimentar frustración anticipatoria. Lo que hacen 
frente a esta frustración prevista depende de la respuesta que se les había entre- 
nado a dar —si había alguna— en la fase 1 del experimento, y la compatibilidad de 
esa respuesta con la de correr, que se medía en la fase 3. En particular, los suje- 
tos que habían tenido reforzamiento parcial en la fase 1 con una respuesta de co- 
rrer (CP) deberían mostrar mayor resistencia a la extinción que aquellos continua- 
mente reforzados (CC). Los sujetos entrenados en la fase 1 con una respuesta de 
saltar deberían mostrar un efecto de reforzamiento parcial un tanto menor (SP 
versus SC). Paradójicamente, se esperaba que el grupo que recibía reforzamiento 
parcial para una respuesta de trepar en la fase 1, fuera menos resistente a la extin- 
ción en la fase 3 que sus controles reforzados continuamente (72 versus 7C). Así 
ocurría claramente en los bloques de ensayo 2, 3 y 4 durante la extinción. La teo- 
ría de Amsel predice este efecto de “reversión'” bajo la premisa de que la reintro- 
ducción de los indicios de frustración en la fase 3 provoca nuevamente las respues- 
tas particulares antes asociadas con el r7-S, (trepar): y se supone que estas res- 
puestas son incomparables con la de correr hacia la meta, con lo cual se acelera la 
extinción de la respuesta de correr en comparación con los controles conti- 
nuamente reforzados. De hecho, Ross observó una elevada incidencia de 
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“trepar” (por las paredes de alambre de la senda) durante la extinción en la fase 3 
de las ratas CP, una respuesta casi inexistente en los otros sujetos durante la ex- 
tinción. 

La significación de este experimento reside en mostrar los efectos de refor- 
zamiento parcial positivo y negativo que se transfieren de una situación de entre- 
namiento a una situación de prueba rmuy alterada, y nos permiten identificar la res- 
puesta aprendida a la frustración anticipatoria como el elemento mediador crítico. 
Demuestra que la frustración excitada por la no recompensa, cuando el animal 
está hambriento y aguarda comida, es muy similar a la excitada por la no recom- 
pensa cuando el animal se encuentra sediento y espera agua. El resultado también 
pone de manifiesto que no podemos caracterizar el efecto del reforzamiento par- 
cial como el enseñarle al animal a tolerar tan sólo la frustración y a persistir en su 
respuesta frente a ella, sino que debemos distinguir con sumo cuidado exacta- 
mente qué respuesta el sujeto ha aprendido a dar a la frustración prevista, y la re- 
lción de ésta con la respuesta criterio en la cual se evalúa la tolerancia a la frustra- 
ción del sujeto. El experimento de Roos tiene una incuestionable significación para 
la teoría de Amsel, Debido a su valor crítico, debería repetirse para verificar su 
confiabilidad. 

Amsel (1967) desarrolló más tarde su teoría de la frustración en situaciones de 


Figura 5.9. Datos 
del experimento de 
Ross (1964), que 
muestran la ejecu- 
ción en el último 
bloque de adquisi- 
ción y durante to- 
dos los ensayos de 
extinción Los da- 
tos se trazan aqui 
como velocidades; 
los tiempos se tra- 
zaron en el informe 
original. Los símbo- 
los que designan 
grupos se refieren 
a trepar, correr O 
saltar (7, €, S) bajo 

g reforzarmiento con- 
Última 1 2 3 4 5 6 7 8 tinuo o parcial (€ 
adquisición o P) [tomada de 

Bloques de cuatro ensayos de extinción Amsel, 1967) 


Velocidad promedio 
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aprendizaje de discriminación; por ejemplo, hacer que el sujeto experimente re- 
forzamiento continuo mientras corre en un pasadizo blanco, y reforzamiento par- 
cíal cuando corre en uno negro. Esta situación produce un efecto de reforzamiento 
parcial generalizado, en donde la resistencia a la extinción de la discriminación del 
animal en su pasadizo de 100% es considerablemente mayor a la de un animal de 
control que al principio ha recibido reforzamiento continuo en ambos pasadizos. 
En algunos casos (véase Pavlik y Carlton, 1965) se encuentra un efecto de refor- 
zamiento parcial inverso, en el cual la discriminación del animal es más resistente a 
la extinción en su situación reforzada continuamente, que en su situación reforza- 
da de manera parcial. En la teoría de Amsel cabría esperar este tenómeno si la mo- 
tivación de incentivo fuera mayor en la situación reforzada de forma continua, 
mientras que el mecanismo de frustración *+-S+=R está igualmente disponible 
para retrasar la extinción en ambas situaciones. 

Siendo una de las concepciones dominantes acerca de la extinción, la teoría de 
la frustración requiere de un análisis crítico, ya que sin duda adolece de varios de- 
fectos. En primer término, los experimentos de Levy y Seward (1969) sugieren 
que en la senda de dos conexiones no ocurre un EF si la rata espera diferentes 
incentivos (agua y alimento) en las dos cajas meta, lo cual es una observación in- 
comprensible. Segundo, la teoría de la extinción de Amsel sólo es aplicable a las 
respuestas instrumentales y apetitivas, y no toca los fenómenos de extinción 
(como los efectos del reforzamiento parcial) en los paradigmas tales como el con- 
dicionamiento clásico o el condicionamiento instrumental de escape (G. H. Bower, 
1960). El reforzamiento parcial en el condicionamiento clásico de defensa (por 
ejemplo, el condicionamiento del parpadeo) incrementa la resistencia de la RC a la 
extinción, pero es difícil imaginar que podría ser frustrante al no recibir un estí- 
mulo aversivo previsto, En tercer lugar, Capaldi y sus colaboradores (Capaldi, 
1967) lograron producir magnitudes diferenciales de resistencia a la extinción me- 
diente variaciones en el patrón secuencial de los ensayos reforzados y no reforza- 
dos que el animal experimenta durante la serie de adquisición; un conjunto de he- 
chos con los cuales la teoría de Amsel no puede hacer contacto. Además, ahora 
se dispone de considerable evidencia (véase Robbins, 1971, para una reseña) 
acerca de un efecto de reforzamiento parcial sobre la extinción, incluso des- 
pués de series de entrenamiento muy cortas (de 5 a 10 ensayos), demasiado 
abreviadas para completar las etapas sucesivas (de condicionamiento f¿, entonces 
Y¿, €tc.) que figuraban en la teoría de Amsel. Estos últimos puntos sugieren que la 
extinción es un proceso con determinantes múltiples, que la hipótesis de la frus- 
tración de Amsel quizá sea un componente de una explicación viable, pero que 
para la gama total de fenómenos dehemos invocar otros mecanismos. La alterna- 
tiva más aceptada en la actualidad es la hipótesis secuencial de Capaldi, la cual es 
una compbicada elaboración de la primera hipótesis de discriminación, El inte- 
resante trabajo de Capaldi se examinará en el capítulo 9. 


Frank Logan 


Frank Logan es otra figura dominante dentro del enfoque hulliano, y ha escrito 
abundantemente desde ese punto de vista (Logan, 1959, 1960, 1970; Logan y Wagner, 
1965). Estudió con Spence en lowa y en Yale durante los últimos años de Hull, y ha 
efectuado varias contribuciones en los campos experimental y teórico. Su interés 
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primordial —que se manifiesta en sus artículos de 1965 y 1969 es determinar la 
forma en que la motivación de incentivo regula la conducta, y cómo ésta a su vez 
es regulada por la condiciones de la recompensa y el castigo. Su punto de vista en 
torno a estas cuestiones se ha reseñado al examinar los problemas que se suscitan 
al identificar la motivación de incentivo con la amplitud 7... 

Es probable que Logan sea más conocido por su enfoque :micromolar de la teoría 
de la conducta, en el que adopta una perspectiva particular acerca de lo que se re- 
fuerza o Jo que se aprende cuando decimos que una respuesta es reforzada. El en- 
foque micromnolar de Logan (1956, 1960) se inicia con un argumento destinado a 
ampliar la definición de la respuesta e incluir sus características intensivas (su ve- 
locidad, amplitud, volumen, etc.). En la concepción clásica, ejemplificada en la teo- 
ría de Hull de 1943, las clases de respuestas se definían en términos de sus logros: 
correr por una pista o presionar una palanca, La regía consiste en agregar todos 
los casos de conducta que obtienen el mismo resultado final (por ejemplo, oprimir 
la palanca); se acumulan de esta forma porque el experimentador no las refuerza 
diferencialmente. Las variaciones en la velocidad o en la amplitud de la respuesta 
durante el entrenamiento se toman como índices de la fuerza de la tendencia de 
respuesta. Hul) formalizó esta idea en su construcción del potencial de reacción E, 
que presumiblemente determinaba Ja probabilidad, la velocidad, la amplitud y la 
resistencia a la extinción de la respuesta. 

Como Logan, entre otros, ha señalado este enfoque clásico se topa con difi- 
cultades en diversos puntos, En primer lugar, a menudo estas diversas medicio- 
nes de respuesta no están bien correlacionadas, Durante el entrenamiento, una 
medición como la probabilidad de la respuesta puede mejorar monotónicamente 
con la práctica, mientras que la velocidad y/o la fuerza de la respuesta puede incre- 
mentarse al comienzo y disminuir en el transcurso de los ensayos, Un ejemplo es 
la latencia de alargamiento de la KC en el condicionamiento clásico (que mencio- 
namos en el capítulo 3), a medida que el animal aprende a calcular el momento de 
llegada del estímulo incondicionado; un segundo ejemplo es que esa fuerza de pre- 
sionar la palanca primero se incrementa y luego disminuye durante el en- 
trenamiento, para estabilizarse apenas por encima de la fuerza mínima requerida 
para operar al alimentador, La segunda dificultad básica del enfoque clásico se de- 
riva del hecho de que podemos reforzar diferencialmente características intensi- 
vas de la respuesta. Skinner (1938) fue el primero en demostrarlo experimental- 
mente, a) poner de manifiesto en la situación de operante fibre el moldeamiento di- 
ferencial de tasas lentas o rápidas de presión de palanca, fuerzas débiles o intensas 
de presión de palanca, y duraciones breves o prolongadas de sostenimiento de pa- 
lanca. El método es la sencillez misma: simplemente consiste en reforzar sólo las 
respuestas cuyas propiedades intensivas caen dentro de un rango de criterio, es- 
pecificado para avanzar posible mente a criterios más estrictos a medida que se de- 
sarrolla la ejecución del animal. Es evidente que muchas ejecuciones especiali- 
zadas se diferencian de este modo. También es obvio que a través de tal refor- 
zamiento diferencial (por ejemplo, la velocidad de respuesta lenta), las pro- 
piedades intensivas de la respuesta: 2) pueden incrementarse O no monotónica- 
mente con el entrenamiento, y b) pueden entrar en cualquier relación con otras 
propiedades intensivas que reforcemos (como hablar en voz alta y baja, hablar 
rápido y lento, etc.). / ] 

Logan amplió la noción del reforzamiento diferencial para incluir cualquier varia- 
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ción en algún parámetro del reforzamiento, como la magnitud del mismo, su cali- 
dad, demora o probabilidad. En condiciones de reforzamiento correlacionado, una o 
más dimensiones del reforzamiento se correlacionan con alguna propiedad inten- 
siva de la conducta observada, como la velocidad de ésta. El término fención es- 
pecifica qué reforzamiento recibe el sujeto por velocidades particulares de res- 
puesta. En este sentido, es similar a las condiciones de un contrato entre el sujeto 
y un agente reforzante (el ambiente o el experimentador). Es posible imaginar una 
gran variedad de funciones de condiciones, y sólo unas cuantas se han investigado. 
Los ejemplos en una situación de pista de carreras podrían ser: cuanto más rápido 
corra la rata hasta la caja meta, más tiempo demorará su recompensa, o mientras 
más rápidamente corra, más grande será la recompensa que reciba; o el refor. 
zamiento puede entregarse sólo cuando la velocidad caiga en el intervalo x a y, y 
no de otra forma, etcétera. En general, se encuentra que los sujetos se ajustan a 
tales condiciones de recompensa y que a la postre responden en un nivel casi ópti. 
mo para algunos resultados y una explicación más detallada (véase Logan, 1960). 

Para tratar con el comportamiento de los sujetos en tales condiciones, Logan 
propuso el enfoque micromolar; es decir, una perspectiva que identifica diferentes 
velocidades como diferentes respuestas, influidas selectivamente por el reforza- 
miento diferencial, En esencia, Logan postula un análisis de utilidad para tratar con 
este acercamiento, aunque especifica los componentes de la utilidad en términos 
de las variables intervinientes del hábito, el impulso, el incentivo, etc., de la teoría 
hulliana. La utilidad neta (o E) de una velocidad particular de respuesta se da por 
su tutilidad positiva menos su utilidad negativa asociada. El componente primordial 
de la utilidad positiva es el incentivo, que aumenta con la cantidad de recompensa 
proporcionada para esa velocidad, y disminuye con el intervalo total de reforza- 
miento para tal velocidad (intervalo total = duración de la respuesta + demora de 
la recompensa después de esa respuesta). Se considera que a través de la expe- 
riencia el sujeto aprende el incentivo asociado con cada velocidad; sin embargo, el 
incentivo para una velocidad dada también es influido por la generalización del in- 
centivo aprendido para velocidades similares. El componente básico del incentivo 
negativo para una velocidad particular es el esfuerzo que ésta necesita, y las res- 
puestas rápidas requieren de mayor esfuerzo. El perfil de la utilidad neta a lo largo 
del continuo de velocidad se usaba, entonces, para calcular la distribución de pro- 
babilidad de las diversas velocidades. En términos generales, la probabilidad espe- 
rada de una velocidad particular de respuesta depende de su utilidad neta en rela. 
ción con la de las velocidades alternativas. Así, la única variable dependiente en la 
teoría es la probabilidad de respuesta, pero aquí la respuesta se refiere a las pro- 
piedades intensivas de la conducta. 

Basta decir que tal teoría explica cualitativamente la ejecución más o menos óp- 
tima que los sujetos logran en condiciones de reforzamiento correlacionado. Como 
el estímulo es específico a velocidades particulares de respuesta, la función de las 
condiciones se traza dentro del perfil de incentivo del modelo, un poco distorsio- 
nado debido a la generalización de los efectos de reforzamiento entre respuestas 
similares. Es así como el modelo del organismo tiene en cuenta y ajusta su com- 
portamiento en relación con la función de las condiciones. 

Además de explicar las condiciones de recompensa correlacionadas, el enfoque 
proporciona una explicación admisible acerca de por qué la perspectiva convencio- 
nal de Hull (darnada macromolar) opera algunas veces y otras falla. Logan señala 
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que casi todas las condiciones de recompensa constante conllevan una correlación 
implícita entre la velocidad de respuesta y el intervalo de reforzamiento: cuanto 
más rápido corra la rata hacia la caja meta, antes consigue la recompensa. La teo- 
tía micromolar predice que una dimensión particular de respuesta mejora monotó- 
nicamente con la práctica sólo si alguna dimensión del reforzamiento mejora con 
esa dimensión de respuesta. Así, aunque la velocidad de presión de palanca se in- 
crementa con la práctica porque las respuestas más rápidas producen antes las re- 
compensas, la fuerza que se necesita para presionar la palanca no se incrementa 
porque las respuestas más vigornsas requieren de mayor esfuerzo y no dan lugar a una 
mejor recompensa. Logan también ha demostrado cómo la teoría micromolar im- 
plica a los efectos usuales sobre la velocidad de respuesta de las variaciones en 
impulso, cantidad y demora de la recompensa en situaciones de recompensa cons- 
tante. Podrían examinarse más detalles en relación con esta teoría, pero saldría- 
mos de la estructura que se le ha fijado a este texto. 

La importancia de la teoría micromolar ha sido básicamente la de realizar una 
limpieza conceptual dentro de la teoría del aprendizaje. Gracias al análisis de Lo- 
gan fue posible descubrir y comprender varios enigmas conceptuales vinculados 
con el problema relativo a la manera en que el reforzamiento modela a la conducta. 
El enfoque micromolar es general y aplicable al condicionamiento clásico y al 
instrumental, e influye sobre la forma en que nos referimos a las variables y pensa- 
mos acerca de ellas. Por ejemplo, en los casos del condicionamiento clásico la teoría 
micromolar afirma que la amplitud de la respuesta aprendida será aquella pro- 
vocada por el estímulo incondicionado. Esto proporciona una interpretación direc- 
ta del hecho de que la amplitud del reflejo condicionado tiene una correlación muy 
alta con la amplitud del reflejo incondicionado. Así, el perro saciado que da una RO 
salival débil ha aprendido su amplitud de respuesta tan bien como el perro ham- 
briento que da una amplitud grande de RC; el primer perro sólo está aprendiendo 
una respuesta de menor amplitud, De modo similar, el animal tiende a aprender a 
salivar con una latencia particular proporcional al intervalo EC-Ef. El enfoque mi- 
cromolar también fue muy útil para interpretar la influencia de varios programas 
skinnerianos de reforzamiento sobre la tasa de respuesta (véase capítulo 7). Al 
menos, algunos programas pueden considerarse como funciones de condiciones 
más o menos inexactas que correlacionan la probabilidad del reforzamiento con el 
tiempo interrespuesta. Por ejemplo, los programas de intervalo variable generan 
tasas lentas de respuesta, lo que puede explicarse debido al reforzamiento dife- 
rencial de tiempos prolongados de interrespuesta. Un reciente trabajo teórico de 
Shimp (1969) proporciona una explicación del tipo de utilidad de la ejecución en un 
programa, en la cual supuestamente el animal selecciona entre un conjunto de 
tiempos interrespuesta a fin de maximizar su momentánea utilidad esperada. 

Además, la perspectiva micromolar logra un mejor contacto con el aprendizaje 
que interviene en muchas de nuestras ejecuciones cotidianas, que el enfoque an- 
tenor. Las consecuencias de reforzamiento dependen generalmente no sólo de si 
se emite una respuesta, sino de si se da en el momento apropiado, en el lugar ade- 
cuado y con el ritmo o intensidad correctas, etcétera. De hecho, es difícil imaginar 
situaciones humanas en las cuales la recompensa no dependa de algún modo 
(como en magnitud, demora o probabilidad) de la destreza con la que se emite la 
respuesta. La teoría micromolar trata a estos aspectos temporales e intensivos de 
h respuesta como parte de lo que se consigue aprender. En este sentido, el trata- 
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malismo sostienen puntos de vista opuestos en lo que a ellos se refiere. Desde 
hace siglos se enfrentan en la arena intelectual y aún en nuestros días, puede re- 


conocerse su influencia en la psicología **científica”. 
Empirismo 


El empirismo sostiene que la experiencia es la única fuente del conocimiento. 
Otorga un estatus especial a la experiencia sensorial, aunque se infiera algún cono- 
cimiento de las reflexiones intelectuales acerca de las relaciones entre las expe- 
riencias. Nuestras ideas provienen de impresiones sensoriales, ya sea como copias 
directas de ellas (las denominadas ideas simples) o como combinaciones de diver- 
sas ideas simples o complejas. La impresión sensible de un objeto (por ejemplo, 
una naranja) puede descomponerse en cualidades sensoriales: sensaciones 
que corresponden a su color, olor, tamaño, textura, sabor, etcétera. Estas cuali- 
dades sensoriales se llegan a conectar (o se ''asocian””) en la mente porque se 
producen muy próximas en el tiempo o en el espacio cuando interactuamos con el 
objeto. La idea de una naranja es compleja, pero reducible a interasociaciones en- 
tre ideas más simples y primitivas. El *“conocimiento”” ulterior adquirido acerca 
de las naranjas puede expresarse al asociar este complejo de ideas con otras ideas 
relacionadas; por ejemplo, que las naranjas son frutas y que son comestibles. 

El empirismo tiene las siguientes características: 

1. Sensualismo, la hipótesis de que todo el conocimiento deriva de la experien- 
cia sensible, 

2. Reduccionismo, que afirma que todas las ideas complejas se construyen a par- 
tir de un tronco básico de ideas simples, y que las ideas complejas son a su vez re- 
ducibles a estas ideas simples. 

3. Asociacionismo, tesis según la cual las ideas o los elementos mentales están 
conectados mediante la operación de la asociación de experiencias que suceden 
muy próximas en el tiempo (contiktiidad). 

4. Mecantcismo, que sostiene que la mente es como una máquina construida con 
elementos simples, sin componentes misteriosos. 

El empirismo implica dos mecanismos básicos del aprendizaje; 1. Represen- 
taciones internas de ideas simples (“imágenes de la memoria””) que se originan 
por el sólo copia» sus correspondientes impresiones sensoriales en el almacén de 
la memoria; y 2. Las ideas complejas se forman al conectar en la memoria ideas 
simples que se experimentan de modo contiguo y se vinculan por una relación aso- 
ciativa, El recuerdo de que al suceso A siguió de inmediato el suceso B, se regis- 
tra en la memoria como una asociación de la idea e a la idea 4. En realidad, esto equi- 
vale a copiar en la memoria el hecho de la co-ocurrencia de los contenidos men- 
tales a y b. Tales asociaciones pueden registrar secuencias temporales o causales 
de sucesos, como raspar un fósforo-encenderlo-calor-fuego. Activar o revivir es- 
tas secuencias asociativas de la memoria constituye el supuesto método mediante 
el cual la mente se mueve de una idea a otra. Este método explica el orden de su- 
cesión en una cadena de ideas durante el pensamiento ocioso O el pensamiento di- 
rigido a un objetivo. Para ilustrar este último tipo de pensamiento, supóngase que 
el evento final en una cadena se convierte en una meta ('*quiero comer un hela- 
do'”). Entonces, pensar en ese objetivo llamará a la mente a un precursor inme- 
diato del mismo en el pasado ('*comprar helado en la tienda””), y éste a su vez 
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miento de la respuesta se vuelve comparable al tratamiento convencional del esté 
mulo, en donde se distinguen variaciones cuantitativas así como cualitativas. Del 
Tnismo modo que un sonido de 80 decibeles y otro de 50 decibeles son estímulos 
diferentes, también un grito y susurro constituyen respuestas vocales distintas. 
De esta forma, el nivel descriptivo de nuestra teoría se acerca a las realidades de 
muchas situaciones de aprendizaje, La teoría micromolar de Logan nos proporcio- 
na los medios para analizar cómo se produce el aprendizaje de respuestas diferen 
ciadas y especializadas, mientras que antes no se había integrado ninguna teoría 
relevante dentro de la tradición clásica. 

Con esta sección cerramos la discusión acerca de los neohullianos y sus contri- 
buciones. La teoría hulliana ha logrado obtener el respaldo de muchos productivos 
psicólogos contemporáneos. Los que hemos mencionado aquí son sólo unos 
cuantos de un grupo muy importante de científicos que trabajan con la orientación 
marcada por Hull, En gran medida, aún es una teoría basada en los resultados del 
aprendizaje animal, y no ha desempeñado un gran papel en los actuales enfoques 
de la memoria humana. Pero esto puede obedecer a las predisposiciones de los ín- 
vestigadores, y a) hecho de que en las dos áreas se tratan problemas distintos. A 
continuación haremos algunas observaciones finales en torno de la posición de Hutl, 


APRECIACIONES DE LA POSICIÓN DE HULL 


Sumario de Hull acerca de los mecanismos del 
aprendizaje 


Hull escribió numerosos trabajos alrededor de múltiples problemas relacionados 
con el aprendizaje. Mantenía una visión darwiniana; es decir, creía que los orga- 
nismos evolucionan de acuerdo con la capacidad de sus sistemas nerviosos para 
adaptar su comportamiento a las exigencias ambientales. Concebía al aprendizaje 
como uno de los medios primordiales a partir del cual los organismos logran adap- 
tarse. En su último libro enumeró y describió ocho mecanismos de comportamien- 
to adaptativo automático (1952a, pág. 347-350): 


1. Las tendencias de respuesta innata proporcionan Jos primeros mecanismos 
automáticos para la adaptación a situaciones de emergencia. 

2. La capacidad primitiva para aprender es el segundo mecanismo, '“un medio 
ligeramente más lento de adaptación a situaciones menos graves”. 

3, La reacción de defensa precedente, que se aprende y se mueve entonces ha- 
cia adelante mediante la generalización del estímulo, proporciona el tercer meca- 
nismo de adaptación. 

4. El cuarto mecanismo es la extinción de actos inútiles, el aprendizaje de res- 
puesta negativa. 

5. El quinto es el aprendizaje mediante el método de ensayo y error. 

6. El sexto mecanismo es el aprendizaje de discriminación, 

7. Un segundo tipo de reacción de defensa precedente, que depende de la per- 
sistencia de las huellas de estímulo (más que de la generalización, como en el caso de 
un objeto peligroso percibido), constituye el séptimo mecanismo. 

8. La reacción precedente fraccionaria (+), con su correlación de estímulo pro» 
pioceptiva (S,), proporciona la *'orientación automática (de estímulo) del compor- 
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tamiento del organismo hacia las metas.'* Hull asigna una importancia particular a 
este mecanismo cuando escribe: 


Otros estudios de este dispositivo automático fundamental conducirán presumuble- 
mente a la comprensión conductual detallada del pensarniento y del razonamiento, que 
constituyen el logro más elevado de la evolución orgánica. De hecho, el mecanismo r¿+Sg 
conduce de una manera estrictamente lógica a lo que antes se consideraba como el núcleo 
mismo de lo psíquico: interés, planeación, previsión, presciencia, expectanicia, propósito, 
etc. (1952a, pág. 350). 


En qué medida es satisfactorio el sistema de Hull 


En muchos aspectos el sistema de Hull era superior a otros sistemas psicológicos 
contemporáneos. Es al mismo tiempo completo y detallado, teórico y aun empírica- 
mente cuantitativo. Es fácil encontrar errores en él porque está elaborado con sumo 
cuidado, tan explícito que sus errores de carácter incompleto o de inconsistencia re- 
sultan sumamente evidentes. Una teoría expresada en el lenguaje literario ordinario pue- 
de sonar muy plausible en tanto sus defectos se disimulan muy bien mediante convin- 
centes ilustraciones (un reproche que se hace a Guthrie). En teorías como la de 
Hull llama la atención encontrar una deficiencia. Una severa crítica de Koch (1954) 
se aprovecha de este carácter explícito de la teoría en cuestión. Por eso, al enjuiciar 
al sistema de Hull no olvidemos que, a pesar de sus defectos, fue un gran avance. 

Harfamos bien en pensar en él como compuesto de dos partes: por un lado, Hull 
se embarcó en una teoría intrépida y total de la conducta, que pudiera servir de 
base a gran parte de las ciencias sociales. Por otro lado, experimentaba con un 
sistema en miniatura muy exacto, con determinadas constantes que se sustenta- 
ban en la experimentación controlada. Intentó combinar estas dos empresas al 
mismo tiempo, y no fue muy hábil para distinguir entre lo que lograba a gran escala 
y lo que conseguía en miniatura, ya que pretendía configurar un único sistema. 

Á gran escala, cuando trataba con la conducta en espacio libre, resolución de 
problemas e ideas, Hull utilizó hábilmente los mecanismos periféricos, en parti- 
cular la secuencia conjeturada »¿-S¿. Al entrelazar estas anticipaciones de meta 
con otras características de su sistema, en especial a través del gradiente del re- 
forzamiento y la jerarquía de familia de hábitos, logró hacer deducciones a gran es- 
cala de las formas familiares de conducta. Cuando se movía en este nivel la teoría 
en verdad era muy ““molar””, y apenas se esforzó en señalar con precisión los ti- 
pos de movirniento anticipatorios (movimientos de mascar, posturas corporales) 
que sirviesen de fundamento tangible a la respuesta precedente traccionaria de im- 
portancia. Las deducciones a gran escala, basadas en »¿, no requieren de ninguna 
tearía especial del aprendizaje, siempre que esa teoría pueda lograr la anticipación 
de la meta, 

Cuando Hull operaba en una escala más pequeña e intentaba ser preciso y cuan- 
titativo, se volvía muy particularista, y confinaba muchos de los postulados y coro- 
larios posteriores a los resultados de experimentos aislados realizados con ratas, 
que presionaban palancas en un caja de Skinner modificada de tal modo que podía 
obtenerse una medición de latencia. Hull se preocupó tanto por esta cuantificación 
que no logró distinguir entre este ejercicio en la construcción de sistema en mi- 
miatura y la tarea más amplia a la cual se dedicaba simultáneamente. Hubiera sido 
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preferible que presentara la generalización provisional y ofreciera separadatnenté 
la evidencia cuantitativa como ilustración. Pero éste es un defecto de estilo de Hull 
en tanto creador de sistemas, y no una deficiencia conceptual básica de la teoría. 

Debemos reconocer que en su época el sistema en cuestión era el mejor (no nece- 
sariamente el más cercano a la realidad psicológica, ni aquel cuyas generaliza 
ciones fueran las más duraderas), sino el elaborado en detalle, con el esfuerzo más 
concienzudo en ser cuantitativo en todos los puntos, en estrecho contacto con las 
pruebas empíricas. Además, fue la teoría más influyente entre-1930 y 1955, a juz- 
gar por los estudios experimentales y teóricos a los que dio lugar, ya fuera en Su 
defensa, su modificación o su refutación. 

Existen varias estimaciones objetivas en torno a la influencia de Hull sobre la 
psicología. Por ejemplo, durante la década de 1941-1950 en el Jourmal of Experi- 
mental Psychology y en el Journal of Comparative and Physiological Psychology, el 
40% de los estudios experimentales y el 70% de trabajos en las áreas del aprendi- 
zaje y la motivación, hacían referencia a uno o más de dos libros y artículos de Hull 
(Spence, 1952), mientras que en el Journal of Abnormal and Social Psychology 
entre los años 1949 y 1952 se citaron 105 veces sus Principles of Behavior, y la si- 
guiente obra a la que se recurría más a menudo aparecía 25 veces (Ruja, 1956). 

Quizá el testimonio más notable del influjo de Hull es el de talento y la producti- 
vidad del gran número de neohullianos a los que alistó en la tarea de desarrollar, 
ampliar y aplicar su teoría. Hombres como Spence, Miller, Mowrer, Judson 
Brown, Grice, Amsel, Wagner, y Logan (y sus discípulos) han sido figuras domi- 
nantes en la psicología estadounidense desde 1940 y alteraron significativamente 
el escenario intelectual de la teoría del aprendizaje. Sus logros y realizaciones 
constituyen un tributo al inspirado ejemplo que estableció Clark Hull, y a la fertili- 
dad teórica del sistema de conceptos por él elaborado. 


LECTURAS COMPLEMENTARIAS 


Los cuatro libros en los cuales se expone la teoría de la conducta de Hull son: 
Hull, C. L. et al., Methematico-deductive theory of rote learning 1940. 
Hull, C. L., Principles of behavior, 1943. 
Hull, C. L., Essentials of behavior, 1951. 
Hull, C. L., A behavior system, 19522. 
Una crítica de la teoría: 
Logan, F. A., “The Hull-Spence approach”, en S. Koch (dir.), Psychology: A stwdy of scien- 
ce, val, 2 1959, 
En el siguiente libro se explica el aprendizaje desde un punto de vista hulliano: 
Logan, F. A., Fundamentals of leaming and motivation, 1970. 
Un libro de texto comprensivo, desde la posición hulliana: 
Logan, F. A. y Ferraro, D.P., Sistematic anulyses of behavior: Basic leaminy and moliva- 
Hional processes, 1978. 
Los puntos de vista de Spence y Mowrer se exponen en los libros siguientes: 
Movwrer, O. H., Leaming Theory and behavior, 1960. 
Spence, K. W., Behavior theory and conditioning, 1956. 
Spence, K. W., Behavior theory and learming: Selected Papers, 1960. 
Para una crítica detallada del sistema de Hull, desde el punto de vista de la lógica de la 
ciencia, véase: . 
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Koch, S., “Clark L. Hull”, en W. K. Estes el al., Modern: learming theory, 1954, págs. 1- 
176. 


Existe una oportunidad excepcional de seguir el curso del pensamiento de Hull mediante 
hos extractos de los 73 “libros sobre la idea'* que escribió, el primero de los cuales se publi- 
có en octubre de 1902, cuando Hull tenía sólo 13 años, y el último artículo, el 21 de abril de 
1952, 18 días antes de su muerte. Estos libros fueron intensamente personales y no estaban 
destinados a la publicación. Según Ámmons (1962), es recomendable comparar los pasajes 
con el contexto autobiográfico de Hull. Las referencias pertinentes son: 


Hull, C. L., **Autobiography””, en H. $. Langfeld et el., A history of psychology in auto- 
biography, 1V, 1952b, págs. 143-162. 

Ammons, R. B., Psychology of the scientist: 11, **Clark L. Hull and his “Idea Books" *, en 
Perceptual Motor Skills, 13, 1962, págs. 800-802. 

Hays, Ruth, Psychology of the scientist: 111, “Introduction to Passages from the 'Tdea Books" 
of Clark L, Hull””, en Perceptual Motor Skills, 15, 1962, págs. 803-806. 

Hull, C. L., Psychology of the scientist: 1V, '“Passages from the “Idea Books" of Clark L. 
Hull'”, en Perceptual Motor Skills, 15, 1962, págs. 807-882. 
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Aprendizaje humano 
por 


asociación 


Durante la época de mayor auge de las principales teorías del aprendizaje, las 
acaloradas controversias entre Hull, Guthrie y Tolman se desarrollaron en los la- 
boratorios de aprendizaje animal, Gran parte de esas polémicas giraba en torno a 
las interpretaciones teóricas acerca de la forma en que las recompensas influyen 
en el aprendizaje y en la ejecución, sobre cómo conceptualizar lo que se aprende y 
cuáles son los ingredientes críticos del aprendizaje. Los debates se realizaron en 
el laboratorio de aprendizaje animal debido a la creencia generalizada de que éste 
sería más fácil de entender que el aprendizaje humano; es decir, que los aspectos 
fundamentales de muchos fenómenos podían estudiarse con la humilde rata que 
aprendía a transitar a través de laberintos, La investigación avanzaba con la premni+ 
sa de que los mecanismos del aprendizaje eran universales en todo el reino animal, 
y que los principios de condicionamiento simples, descubiertos en los animales in- 
feriores, podrían aplicarse a los seres humanos con sólo ligeras modificaciones, Se 
disponía de la suficiente evidencia corno para que esta tesis fuera plausible: por 
ejemplo, el condicionamiento clásico de la RGP y el parpadeo, realizado con seres 
humanos, demostró que las variables de la situación del condicionamiento, como la 
longitud del intervalo £C-Ef, tenían efectos similares a los que se habían en- 
contrado en los animales. 


LA TRADICIÓN DEL APRENDIZAJE HUMANO 


Paralelamente al desarrollo de las investigaciones acerca del condicionamiento 
animal dominadas por la teoría, se llevó a cabo un conjunto de estudios relaciona- 
dos con el aprendizaje por asociación en los adultos humanos, referidos en parti- 
cular a la adquisición de asociaciones simples E-R y cadenas de asociaciones. Á 
estos trabajos se les denominó estudios de aprendizaje verbal, aprendizaje senso- 
motor o aprendizaje de habilidades. En esta sección examinaremos la tradición del 
aprendizaje verbal, puesto que la corriente tiene un fundador definido, un comien- 
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zo claro y paradigmas definitivos, elementos de los cuales se ha carecido en el 
área de investigación de las habilidades motoras. Las reseñas de la bibliografía 
acerca de dichas habilidades pueden consultarse en el texto de Welford (1976) o 
en el volumen editado por Bilodeau (1966). 

La trayectoria del aprendizaje verbal se inició con Herman Ebbinghaus, a partir 
de la publicación de su tratado Uber der Gedáchtnis (Acerca de la memoria), en 
1885. Ebbinghaus comenzó su trabajo en la tradición del empirismo y el asocia- 
cionismo, y demostró que los procesos del aprendizaje por asociación —que han 
sido temas de gran especulación entre los filósofos— podían medirse en el labora- 
toño. Si tenemos en cuenta el contexto histórico, es indudable que sus logros fueron 
considerables: 

1. En lugar de basarse en informes introspectivos de la memoria, prefirió sus- 
tentar su trabajo en informes objetivos, y empleó el método de reaprendizaje y la 
puntuación de ahorro para inferir la retención cuando fallaba el recuerdo consciente. 

2. Ideó unidades calibradas (silabas sin sentido) que suministraban un número 
¡limitado de nuevos materiales de aprendizaje para la experimentación. 

3. Puso en tela de juicio las leyes establecidas de la asociación, en particular las 
de la sucesión temporal, al introducir un estudio cuantitativo de las asociaciones 
remotas. 

4. Aplicó métodos de análisis estadísticos para sintetizar sus resultados y discu- 
tir la significación y la magnitud relativa de los efectos de diversas variables del 
aprendizaje. 

Ebbinghaus creó una nueva situación experimental (el aprendizaje de sílabas sin 
sentido) en la cual podía definir un sinnúmero de variables y abservar la influencia 
de las mismas sobre conductas de *“recuerdo””. Los fenómenos que descubrió aún 
sun objeto de interés, y sus teorías de la asociación perduraron a lo largo del tiem- 
po, de manera que durante años la investigación del aprendizaje verbal estuvo in- 
fuida por sus principios. Los trabajos subsecuentes desmenuzaron las variables 
de las situaciones de aprendizaje verbal, las midieron y determinaron las leyes que 
las rigen. En el transcurso de esta investigación, la situación y los paradigmas 
del aprendizaje sufrieron constantes modificaciones; en cierto sentido, la tarea del 
análisis empírico continuamente volvía a plantearse desde el comienzo. Los tres 
paradigmas primordiales del aprendizaje verbal que se han estudiado con mayor 
profundidad son los siguientes: 

1. Aprendizaje sería!, El sujeto aprende a recitar una lista de reactivos (sílabas, 
palabras, dígitos) en un orden serial especificado. La recitación puede hacerse sin 
ayuda o instigarse serialmente; en el último caso, después de cada intento por re- 
cordar un reactivo, el segundo de ellos se presenta como un indicio para el que si- 
gue en la serie. 

2. Aprendizaje de recuerdo libre. El sujeto intenta recitar una lista de reactivos 
en cualquier orden que elija, a cualquier velocidad. La lista se presenta sólo una 
vez 0 Se repite en varias ocasiones, ya sea en el mismo orden o con una variación 
aleatoria. 

3. Aprendizaje de pares asociados. El sujeto aprende una lista de asociaciones 
úscretas (pares de sílabas o palabras), designadas genéricamente como A-B, Por 
lo general, los pares se aprenden bajo las instrucciones de que A servirá como 
indicio (instigador, estímulo) para el recuerdo de B (como la respuesta). Las res- 
puestas pueden ser conocidas y asequibles (como los botones en un teclado) o 
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reactivos que deben aprenderse como unidades (por ejemplo, las palabras de un 
idioma extranjero). 

Estos paradigmas en parte se definen por las unidades que hay que memorizar 
(listas de reactivos aislados versus pares), y por el criterio de ejecución requerida 
(por ejemplo, recuerdo ordenado versus no ordenado). La rememoración estable. 
cida mediante cualquier procedimiento de los mencionados se comprueba por re» 
cuerdo, reconocimiento o reconstrucción. Cada paradigma puede usarse con pe- 
queñas cantidades de material, con intervalos de retención breves o largos. Ade- 
más, por supuesto, la persona puede aprender varias listas distintas en sucesión, 
de modo que sea posible examinar la influencia del aprendizaje de una lista sobre el 
aprendizaje o retención de otra. A medida que las variables aisladas y estudiadas, 
se va acumulando una gran reserva de información empírica acerca de la manera 
en que los seres humanos aprenden en estas situaciones. Con el objeto de inte- 
grar y explicar la evidencia disponible en torno de alguna pregunta particular se 
ban propuesto diversas hipótesis. 


LA TEORÍA EN EL APRENDIZAJE VERBAL 


Durante los años comprendidos entre 1900 y 1930, gran parte de los estudios 
del aprendizaje verbal fue realizada por un grupo de psicólogos que se autodeno- 
minaban funcionalistas (véase el capítulo 9 en Hilgard y Bower, 1975). El funcio: 
nalismo constituía un difuso conjunto de premisas metodológicas, pera su objetivo 
central era realizar un detallado análisis experimental de habilidades o tareas psi- 
cológicas importantes, Así, la idea que servía de guía consistía en diseccionar una 
tarea determinada, como el aprendizaje verbal en serie, en un número de compo- 
nentes o habilidades constitutivas, y analizarlas de modo experimental. La preocu- 
pación por la descripción empírica llevó a los investigadores a evitar las teorías 
globales y las controversias que les eran inherentes, que bullían en los laborato- 
rios del condicionamiento animal. En su lugar, los estudiosos del aprendizaje ver- 
bal pensaron que la verdad se revelaría mediante el paciente análisis empírico de 
tareas específicas de aprendizaje (véase McGeogh y Irion, 1952). 

La teoría findamental del aprendizaje que sustentaba a la investigación del 
aprendizaje verbal era el asociacionismo general, complementado en sus últimos 
años con algunos conceptos procedentes de la teoría de Hull. De esta manera, 
Ebbinghaus inició su trabajo en la tradición del asociacionismo. La idea básica era 
que el recuerdo podía reconstruirse en términos de conexiones (asociaciones) 
entre las ideas, y que éstas se registraban en la meta (memoria) mediante la ocu- 
rrencia contigua de las dos ideas en la conciencia. Se suponía que esta contigúi- 
dad mental de las ideas a ser asociadas se origmaba en la contigilidad objetiva 
(en tiempo o en el espacio) de los eventos externos que excitan a sus corres 
pondientes ideas en la mente, o en la persona que piensa en (recobra de la me- 
moria) una segunda idea mientras considera a la primera. La recuperación durante 
esta segunda forma de contigilidad se caracterizaba por la existencia de una simi- 
litud o relación entre la idea instigadora y la compañera que recupera de la me- 
moria. Por cualquier medio que ocurriera, se creía que la experiencia contigua 
de las ideas A y B en la conciencia establecía una conexión o vínculo asociativo 
entre sus representaciones internas. Esta asociación, o ““línea'*, del nodo A al 
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nodo B podría variar en fuerza, y afectar la probabilidad y velocidad con las que 3 
viene a la mente cuando Á entra en la conciencia. Un determinado elemento 
puede estar asociado con otros diferentes, designados como A-B, A-C, A-D, y así 
sucesivamente, Estos se ordenarán según su fuerza en cualquier momento dado, 
Cuanto más fuerte sea la asociación A-B, más probabilidades habrá de que triunfe 
el competir con respuestas alternativas. El aprendizaje consiste en el gradual for- 
talecimiento de la asociación con la respuesta correcta, de mudo que ésta siga al 
estímulo con más seguridad que las respuestas erróneas. Antes de examinar el 
proceso de elaboración de esta teoría del aprendizaje verbal, nos detendremos a 
analizar la forma en que aborda la cuestión del reforzamiento en el aprendizaje hu- 
mano, ya que desempeñó un papel central en otras teorías del aprendizaje. 


El reforzamiento en el aprendizaje humano 


El experimento típico de aprendizaje verbal está diseñado de manera deficiente 
para el estudio de la motivación, la recompensa y la influencia de estos factores so- 
bre la velocidad del aprendizaje o la ejecución. Por lo general, los sujetos son estu- 
diantes universitarios, ya complicados en lo que concierne a motivarse y reconr 
pensarse a sí mismos por aprender prácticamente cualquier material que se les 
presente. La motivación usual para que se comprometan con la tarea de aprendi- 
zaje verbal la proporcionan las instrucciones del experimentador y el deseo del su- 
jeto de cuoperar y trabajar a fin de ganar su remuneración (en este caso el puntaje 
o los créditos de un curso). Dichas instrucciones por lo común definen la tarea, 
orientan a los sujetos hacia ella, inician el ordenamiento del material que se intenta 
aprender, puntualizan los criterios para una correcta ejecución, y la mantienen du- 
rante todo el entrenamiento. A estos procedimientos se los ha denominado cox- 
junto de aprendizaje intencional, y posiblemente existan como un fondo común de 
estrategias de aprendizaje que los estudiantes adquieren mediante la educación 
formal para el momento en que lleguen a la universidad. 

Muchas investigaciones demuestran que la intención de aprender tiene su efec- 
to fundamental al iniciar ciertas actividades de repetición o de elaboración en rela- 
ción con el material que ha de aprenderse (véase Postman, 1964). Pero si estas mis- 
mas actividades son evocadas por otras tareas orientadoras, sin la intención de 
aprender, el sujeto aprenderá incidentalmente casi la misma cantidad, Por ejem- 
po, si alos sujetos se les pide que construyan oraciones significativas de pares de 
palabras (en este caso, **pluma-disco'” podría convertirse en **Mi pluma rayó un 
disca””), asociarán los pares de palabras como lo indique su habilidad posterior 
para recordar la segunda palabra cuando se instigue con la primera. Este aprendi- 
zaje *“incidental'” no mejora de ningún modo si a los sujetos generadores de ora- 
ciones se les pide, además, que recuerden el material para una prueba posterior 
de recuerdo. Lo importante es lo que los sujetos hacen con el material cuando se 
les expone a él, y no su intención de aprender o la razón que se les dé para realizar 
estas actividades. 

Los investigadores del aprendizaje verbal siempre han adoptado una ley empí- 
fica del efecto. Comprendieron que la situación experimental se dispune de tal for- 
ma que el reforzamiento que promueve al aprendizaje consiste en información 
acerca de la respuesta correcta. Asi, una respuesta seguida de la calificación de 
“correcto” por parte del experimentador incrementará la probabilidad de que la 
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misma se emita frente a su estímulo; y el informar al sujeto de la respuesta correc- 
ta tiene un efecto similar. Thorndike suponía que la respuesta sería recompensada 
(causaría satisfacción y se fortalecería) cuando se igualaba con la respuesta desig- 
nada como correcta, y que de no ser así sería recompensada o castigada. El punto 
de vista opuesto a la ley del efecto, de Thorndike, es que la información acerca de 
la respuesta correcta basta para promover el aprendizaje, y que los satisfactores 
posteriores a ella resultan irrelevantes. Esta opinión y la evidencia que la apoya in- 
dudablemente tienen más en su favor que la visión original de Thorndike de la re- 
compensa en el aprendizaje humano. Por supuesto, para el funcionalista interesa- 
do en diseccionar las tareas de aprendizaje, la posición adoptada en este tema de la 
recompensa de cierto modo insustancial. Quizá porque relativamente no se preo- 
cupaban por los temas de la motivación y el reforzamiento, el análisis de los funcio- 
nalistas acerca de las tareas del aprendizaje verbal avanzaba con prontitud sin er 
redarse ni detenerse en los grandes debates y controversias generados entre las 
teorías globales (como los sostenidos por Hull, Tolman), que abundaron desde 
1930 hasta 1950, 

A continuación examinaremos las elaboraciones de la teoría básica de la asocia- 
ción desarrolladas por los teóricos del aprendizaje verbal para explicar los fenó- 
menos fundamentales descubiertos en los estudios de aprendizaje serial, del 
aprendizaje de pares asociados, de la transferencia del entrenamiento y del olvido, 


HIPÓTESIS DEL APRENDIZAJE SERIAL 


Ebbinghaus sólo investigó el aprendizaje serial y estableció numerosas relacio- 
nes funcionales. Incluía los efectos de la longitud de una lista sobre el tiempo para 
aprenderla, los efectos de diferentes tiempos de estudio o número de ensayos so- 
bre la cantidad subsecuente retenida, y los efectos de la duración del intervalo de 
retención sobre la cantidad retenida. En un análisis asociativo, una lista en serie 
designada como A-B-C-D-E ..., se representaría en la mernoria mediante una ca- 
dena de asociaciones directas, A con B con C, y así sucesivamente, de modo que 
ver o pensar en el reactivo A excitara la asociación A-B y diera lugar a la respuesta 
B, la cual a su vez excitaría a la asociación B-C y originaría la respuesta C, et- 
cétera. Sin embargo, Ebbinghaus observó que los aprendices cometían fre- 
cuentemente el error de recordar un reactivo en una posición anterior a la correc- 
ta. Así, después del recuerdo de A y B, el sujeto podía recordar equivocadamente 
D o E en hugar de C. Tales errores anticipatorios seguían un gradiente de distan- 
cia, en el que los errores más probables eran los cercanos. 


La doctrina de las asociaciones remotas 


Estos errores anticipatorios distantes llevaron a Ebbinghaus a postular que la 
estructura asociativa establecida durante el aprendizaje serial incluía asociaciones 
remotas hacia adelante, así como otras adyacentes. Dichas asociaciones se descri- 
ben en la figura 6.1, donde las líneas continuas representan a las asociaciones ad- 
yacentes y las líneas punteadas a partir de cada elemento hasta cualquier otro que 
lo siga en la serie, señalan las asociaciones remotas. Podría suponerse que éstas 
se activarán en cualquier punto de la serie, y llevarán a errores anticipatorios con 
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Figura 6.1. Diagrama de asociaciones adyacentes y remotas formadas durante el 
aprendizaje de un orden serial de reactivos, 


grados decrecientes de lejanía. Para alcanzar la ejecución perfecta, las asocia- 
ciones adyacentes correctas deben fortalecerse en relación con las asociaciones 
remotas. 

Ebbinghaus creía que la existencia de tales asociaciones remotas (errores de or- 
den) ponía en duda a la doctrina de la asociación por simple contigúidad, ya que el 
estímulo A no estaría inmediatamente próximo a un reactivo remoto como €, D, o 
E. Lepley (1934) y Hull (1935) trabajaron en torno a este problema en un perfec- 
cionamiento ulterior de la teoría. Estos investigadores conjeturaron que cada 
reactivo de estímulo declinante que perduraba y estaba presente cuando se evoca- 
ban y reforzaban respuestas posteriores en la serie. Por lo tanto, la asociación de 
estas respuestas C, D, E con la huella del estímulo 4 constituía un mecanismo 
para producir fuerzas graduadas de asociaciones para los reactivos remotos en la 
serie. Dicho proceso se describe en la figura 6.2. 

Además de los errores anticipatorios, la evidencia que Ebbinghaus ofrece en 
apoyo de la existencia de las asociaciones remotas es que el aprendizaje de una 
lista da lugar a lagunos ““ahorros'* en el aprendizaje de una lista derivada de 
otra previamente aprendida. Si la lista original es A, B, C, D, £ ..., entonces una 
lista derivada de primer orden salva cualquier otro reactivo como en A, C, E, ..., 
y una lista derivada de segundo orden saltea dos reactivos como en A, D, G ... Ac- 
tuando él misrno como único sujeto, Ebbinghaus descubrió que comparadas con 
una lista desordenada, las listas derivadas eran más fáciles de aprender, y esa faci- 
lidad aumentaba ligeramente cuanto más pequeña fuera la brecha al derivar la lista 
remota. La observación parece ser congruente con la predicciones de su doctrina 
acerca de las asociaciones remotas. 


Figura 6.2. Represen- 
tación estimulo-res- 
puesta de las series 
AB,C,D.... Lapre- 
sentación de cada 
estímulo conduce a 
su pronunciación. Las 
huellas del estimulo 
(e minúsculas) perse- 
veran y se asocian (li- 
neas onduladas) con 
respuestas más remo 
tas en la serie. 
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Aunque este cuerpo teórico motivó muchas investigaciones, el juicio último 
debe señalarlo como incorrecto en tanto se basa en una interpretación errónea de 
los datos. En primer lugar. la existencia de errores de orden per se no implica ne- 
cesariamente asociaciones remotas entre los reactivos. También sería posible 
imaginar que los reactivos se asocian a algunas representaciones internas de posi- 
ciones seriales (por ejemplo, los números ordinales “*primero es A, segundo es B, 
tercero es C,” y así sucesivamente), y que los errores de orden reflejan gene- 
ralización del estímulo de las respuestas entre estímulos ordinales similares, como 
hemos visto en el capítulo 2 al tratar acerca de la propagación del efecto. Esto ex- 
plicaría el gradiente de los errores remotos, al igual que el hecho de que los erro- 
res de recuerdo serial tienen cierta prubabilidad de ubicarse hacia atrás (por ejem- 
plo, decir B después de E) así como hacia adelante. En segundo término, el méto- 
do de la lista derivada parece haberle producido una ligera transferencia positiva a 
Ebbinghaus, porque éste conocía o podía detectar su principio de construcción 
(por ejemplo, saltear un reactivo y el otro no) y por ello podía utilizar directamente 
su conocimiento de la serie inicia] para acertar en la lista derivada. Los experimen- 
tos de Slamecka (1964). que usó listas derivadas de espaciamiento variable entre 
reactivos, evitaban este problema, y sus sujetos no mostraban ahorro en abso- 
“to. Con más seriedad, Young, Hakes y Hicks (1965) descubrieron que las listas 
derivadas de hecho creaban condiciones de fransferencia negativa, ya que en el 
aprendizaje de una lista derivada como A, C, E ..., las asociaciones adyacentes A- 
B, C-D, E-F, adquiridas en la lista original debían ser excitadas, y competirían e 
interferirían con la adquisición y ejecución de las nuevas asociaciones correctas. 
Por lo tanto, si la familiarización con los reactivos Per se puede controlarse (por 
ejemplo, «l usar palabras comunes y acostumbradas), la condición de la lista deri- 
vada debería producir transferencia negativa. Como prueba de esta conjetura, 
Young y sus colegas descubrieron una gran transferencia negativa (aprendizaje 
más lento) de una lista en serie derivada de primer orden, en comparación con los 
sujetos de control que aprendían estos reactivos por vez primera. En consecuerr 
cia, la metodología de la lista derivada se ha desprestigiado, como también la doc- 
trina de las asociaciones remotas. 

En análisis posteriores del aprendizaje serial, los investigadores distinguieron 
entre aprendizaje de reactivo y aprendizaje de orden. El primero se refiere a la ca- 
pacidad de los aprendices para recuperar los reactivos como respuestas unitarias 
de la memoria, mientras que el segundo alude a su habilidad para colocar los 
reactivos recuperados en el orden serial correcto. Los factores que afectan la ase- 
quibilidad del reactivo, como el carácter significativo o la familiaridad, incidirán en 
el recuerdo del reactivo y, por consiguiente, afectarán indirectamente al recuerdo 
serial. En estudios más recientes del aprendizaje serial, este componente de 
aprendizaje de reactivo a menudo se evita al emplear respuestas familiares como 
letras o dígitos; los sujetos tal vez conozcan el conjunto exacto de reactivos, de 
modo que su única tarea en cada ensayo consiste en recordar un orden espe- 
cificado. 


La curva de la posición serial 


Uno de los hechos interesantes acerca del aprendizaje serial es que la facilidad 
del aprendizaje de un reactivo depende de su posición en la lista de la serie. En la 


179 


1 

39 

e 

$8 

37 

o 

35 

Es 

B4 
Figura 6.3, Errores en cada posición se- É E 
rial en el aprendizaje de una lista serial Z 2 
de 12 reactivos de sílabas sin sentido y] 
por dominar Los errores incluyen fra- o Y PS A E ES ES 
casos de respuesta (tomada de Hov- E A 
land, 1938). Posición serial 


figura 6.3 se aprecia una curva característica de error en la posición serial; los 
reactivos al comienzo y al final de la lista se aprenden con mayor rapidez, mientras 
que aquellos colocados precisamente antes del punto medio son los más difíciles. 
La forma relativa de tales curvas de error de posición serial parece constante en el 
transcurso de los cambios en muchas variables que afectan la tasa de aprendizaje 
general de la lista; por ejemplo, carácter significativo de los reactivos, tasa de pre- 
sentación, e intervalo interensayo (McCrary y Hunter, 1953). El número absoluto 
de errores varía con tales factores, pero el porcentaje relativo de todos los que 
son atribuibles a los errores en cada posición produce una curva casi igual. Debi- 
do a la atractiva sencillez de esta invariancia, muchos teóricos han intentado 
explicarla, de manera que nos detendremos a examinar algunos de esos esfuerzos. 

Una de las primeras teorías de la curva de posición seriai fue la de Lepley (1934) 
y Hull (1935), que aplicaban insistentemente la idea de las asociaciones remotas y 
la adquisición de las conexiones inhibitorias para Suprimir esos errores remotos. 
Se creía que estos factores de inhibición se acumulaban más en las respuestas de 
supresión a la mitad de la lista, y par lo mismo la mayor parte de los errores se 
producían en las posiciones medias. Por ajguna extraña lógica se suponía que las 
conexiones inhibitorias que abarcaban posiciones adyacentes (así, la inhibición de no 
dar E, a B abarca al par C-D) provocaba errores en esa posición interior. Los de- 
talles no son importantes, ya que las premisas básicas de la hipótesis (es decir, las 
asociaciones remotas) se han descartado al igual que la teoría construida sobre esa 
base. 

Una segunda teoría interesante acerca del efecto de la posición serial fue pro- 
puesta de forma independiente por Jensen (1962) y Feigenbaum, y Simon (1962). 
En esta ocasión describiremos la posición del primero, cuya teoría se aplica a la si- 
tuación en la cual un sujeto se expone a repetidos ensayos con la misma hsta se- 
rial, de modo que el final de la lista va seguido de inmediato por el comienzo de la 
que corresponde al próximo ensayo. Jensen supone que los reactivos aprendidos 
en primer término (o los mejor aprendidos) suelen ser aquellos a los que el sujeto 
presta atención primero, o de hecho el primer reactivo o los dos iniciales de la lis- 
ta, Tales reactivos aprendidos en primer lugar sirven entonces como “*punto de 
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apoyo” para aprender los restantes de la lista. Se cree que el sujeto aprende con 
más facilidad al vincular Jos reactivos nuevos con los que previamente ha aprendi» 
do. Esto implica que los reactivos se aprenden alrededor de los puntos de apoyo 
en dirección hacia adelante o hacia atrás. El aprendizaje se expande en torno del 
primer o segundo reactivos en cualquier dirección. El orden de aprendizaje de los 
datos presentados en la figura 6.3 puede predecirse al doblar la serie de 12 reacti- 
vos alrededor del punto de apoyo de los primeros dos reactivos de la siguiente ma- 
nera (comience por el medio): 


Posición 
senal: 38, 9, 10, 11, 12,1,2,3,4,5,6, 7 
Orden de 
aprendizaje: 11, 9, 7, 5,3, 1,2, 4, 6, 8, 10, 12 


El orden pronosticado de aprendizaje es reactivos 1, 2, 12, 3, 11, 4, 10, 5, 9, 6, 
8, 7. La regla consiste en comenzar con los primeros dos reactivos y entonces al- 
ternar reactivos sucesivos desde el final de la serie y lejos del comienzo de la mis- 
ma. Esta noción parece muy válida para predecir la dificultad de la posición serial; 
la correlación promedio entre el rango de la dificultad de posición pronosticada y los 
errores obtenidos era de alrededor de 0.97 para unas 70 curvas de error de posi- 
ción serial, que Jensen cotejó con la bibliografía experimental. Por ejemplo, para los 
datos de Hovland que aparecen en la figura 6.3, la regla de Jensen predice el rango 
de las puntuaciones de error con sólo un ligero error de orden (los reactivos 6 y 9 
son contrarios a lo pronosticado). El ajuste de la teoría es casi tan alto como la 
confiabilidad de las curvas de posición serial obtenidas en diferentes estudios. 

Un problema con el enfoque de Jensen es que básicamente consiste en un cálcu- 
lo que describe las curvas de la posición serial, pero el mecanismo sustentador 
en el cual se fundamenta (es decir, vincular los reactivos con los puntos de apoyo en 
expansión) parece poco plausible. Además, algunas tareas como el recuerdo inme- 
diato de una serie oída una vez (la prueba familiar del segmento de memoria) pro- 
ducían curvas ordenadas del error de posición serial como las de la figura 6.3, pero 
es difícil ver cómo se aplica en verdad la teoría del punto de apoyo a una tarea de 
un ensayo (por ejemplo, aprendizaje de reactivos al final de la hsta como “cerca- 
nos'” al punto de apoyo del primer reactivo). Como el mecanismo básico de apren- 
dizaje es un tanto vago e improbable, la teoría de Jensen no ha sido totalmente 
aceptada a pesar de su reconocida capacidad para predecir curvas relativas de 
error en posición serial. 


Carácter distintivo de la posición serial 

Una teoría reciente y atractiva de la curva de la posición serial la considera como 
un caso especial de la distintividad diferenciada de las posiciones a lo largo de cual- 
quier serie ordenada de estímulos. Esta teoría aírma que alguna representación 
de la posición serial es un componente de estímulo importante para los reactivos de 
una lista serial, y que los extremos de dicha lista son más discriminables o distin- 
tivos, por lo cual son mejores estímulos que las posiciones interiores de la lista. 
Murdock (1960), Ebenholtz (1972) y G. H. Bower (1971) ban articulado la teoría 
en cuestión y revisaron diversos estudios que demuestran que las curvas de la po- 
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sición serial surgen cuando el sujeto debe aprender a asignarles diferentes res- 
puestas a los estímulos que varían a lo largo de una sola dimensión. Un ejemplo se- 
ría el aprendizaje de asignar letras o nombres consistentemente a diferentes lon- 
gitudes de líneas, o tonalidades de gris, alturas de tono, localizaciones espaciales 
de un punto, a intervalos transcurridos. En el experimento típico, estos estímulos 
se presentan uno a uno en orden aleatorio, como en el paradigma de pares asocia- 
dos. En cada caso, se producirían menos errores en las asignaciones a los estímu- 
los finales y más en los interiores. Bqwer (1971) señalaba que tales resultados son 
predecibles al suponer gradientes iguales de generalización de las respuestas aso- 
ciadas con cada posición de estímulo (véase la figura 6,4); aparecen más errores a 
mitad de la serie porque las respuestas generalizadas pueden inmiscuirse allí a 
partir de estímulos similares desde cualquier lado de los estímulos clave. Como 
contraste, la respuesta correcta es relativamente dominante para los estímulos fi- 
nales, ya que los errores de intrusión sólo pueden generalizarse desde un lado. 
Esto se observa fácilmente al sumar las tendencias de generalización para las res- 
puestas de error en cada estímulo en la figura 6.4. Esta teoría es muy semejante a 
la de Spence acerca de la dificultad de las discriminaciones de tamaño medio (véa- 
se la figura 5.7). Ambas manejan los resultados del aprendizaje de serie repetida al 
suponer que el sujeto establece algo así como ''marcadores de posición serial”” 
(por ejemplo, primero, segundo ...) con los cuales asocia los reactivos sucesivos 
de la lista, pero los marcadores son más o menos distintos, y por eso las respues- 
tas se generalizan entre los de posición cercana. Ebenholtz (1972) informa de mu- 
chos experimentos en los cuales se demuestra que la validez del aprendizaje de 
posición es una forma dominante en el aprendizaje serial. 

Ebenholtz y Bower dan un paso más al sugerir que los marcadores de posición 
serial tal vez sean abstractos y se les pueda transferir a diferentes conjuntos de 
estímulos orderiados linealmente, ya sea dentro de la misma dimensión sensorial a 
auna dimensión distinta. Por ejemplo, después de aprender a asignar un conjunto 
de sílabas sin sentido a líneas de diferentes longitudes, los sujetos de Ebemholtz 
mostraron una transferencia positiva cuando las rusmas respuestas se transferían 
y asignaban en el mismo orden anterior a un conjunto de manchas grises que va- 
riaban en cuanto a brillantez. Es decir, la respuesta aprendida a la línea más corta 
se asignaba a la mancha más oscura, y las respuestas restantes se mantenían or- 
denadas como se habían aprendido previamente. Esta transferencia, realizada con 
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estudiantes universitarios, se explica al suponer que los sujetos convierten los es 
tímulos del conjunto en ciertos códigos abstractos como *“el menor, el que le sigue 
al menor,..., el del centro, ..., el anterior al mayor, el mayor”, y que entonces 
asociaban respuestas específicas a dichos códigos, En cualquier caso, la teoría se 
ha alejado mucho de los lineamientos originales de Ebbinghaus en torno de las aso» 
ciaciones remotas. 


APRENDIZAJE DE PARES ASOCIADOS 


En el aprendizaje de pares asociados (APA) se proporciona un estímulo explí- 
cito para cada término de respuesta. Por lo común, el sujeto aprende concurren- 
temente un número de pares empleando el método de anticipación; es decir, se 
presenta el estímulo, el sujeto responde, y se proporciona retroalimentación. El 
aprendizaje de pares asociados se hizo muy popular debido a su obvio cariz de vali- 
dez para el asociacionismo de estímulo y respuesta que dominara en la investiga- 
ción del aprendizaje humano en los años posteriores a 1940, Sin embargo, la sen- 
cillez del APA sólo es aparente, ya que los resultados rápidamente se tornan 
complejos. 

Siguiendo el programa del análisis constitutivo, los investigadores en el aprer- 
dizaje verbal han dividido al APA en tres procesos componentes: aprendizaje para 
discriminar entre los estímulos, aprendizaje de las respuestas como unidades, y 
aprendizaje para asociar la unidad de respuesta correcta con cada estímulo. Las 
modernas teorías del APA tratan con estos tres procesos. Un experimento de 
McGuire (1961) los ilustró con suma claridad, y además permitió evaluar la contri- 
bución de cada factor a la ejecución de la conducta compleja mostrada en el APA, 
A continuación veremos algunos materiales relacionados con estos procesos com- 
ponentes. 


Aprendizaje de discriminación 


El aprendizaje de pares asociados implica claramente el aprendizaje de la discri- 
minación de estímulo. En un artículo clásico, Eleanor Gibson (1940) reconocía 
este principio y aplicó sistemáticamente al APA la teoría de Hull acerca del aprerr 
dizaje de discriminación, Ésta presupone que la fuerza del hábito se acrecienta en- 
tre un estímulo y su respuesta correcta durante cada ensayo reforzado, que una 
respuesta asociada con un estímulo puede generalizarse a otros estímulos simila- 
res y causar errores de confusión o el bloqueo de la respuesta correcta por parte 
de la generalizada. Además, como las tespuestas de generalización no se refuer- 
zan, la persona desarrollará inhibición y suprimirá errores generalizados específ- 
cos en cada estímulo en que ocurran. Según esta opinión, los errores arte un estí- 
mulo dado cesan cuando la respuesta correcta tiene una fuerza neta (hábito menos 
inhibición) que excede a la fuerza generalizada neta de cada una de las respuestas 
competidoras. 

Aunque la teoría es medianamente compleja, predice un número de hechos bien 
conocidos acerca del APA, Primero, hay una clara generalización del estímulo de 
rante el APA y después de él. Así, una respuesta asociada con un estímulo de tres 
letras como Q F H ocurre hasta cierto grado para QE HoQ FP oQ4H. Segun- 
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do, el APA avanza con mayor lentitud cuanto más grande sea la similitud entre los 
estímulos en la lista. Así, insumirá más tiempo aprender nombres para el conjunto 
de estímulos QFH, QHF y FQH. que se superponen en elementos, que para 
ABC, DEF, y GHÍ, que no se superponen en absoluto. Tercero, en un trabajo 
posterior, Gibson amplió la teoría aj postular que a los sujetos se les podría ense- 
ar características discriminativas de los estímulos de modo que se obtuviese la 
transferencia positiva cuando los mismos estímulos estuvieran asociados con un 
segundo conjunto de respuestas diferentes. En un experimento, Goss (1953) des- 
cubrió tal efecto de experiencias de “'prediferenciación”” en las cuales los sujetos 
comparaban estímulos y notaban en qué diferían éstos; más adelante el APA 
de nuevas respuestas a estos estímulos era más rápido que para los sujetos de 
control previamente expuestos a estímulos diferentes. 

Investigaciones posteriores han aceptado los hechos generales acerca de los 
efectos de similitud en el APA pero no simpatizan mucho con la formulación parti- 
cular de Gibson acerca del papel de los factores inhibidores en el proceso. Algunas 
teorías ulteriores de la discriminación del estímulo en el APA procedieron de una 
forma radicalmente distinta de la del intento inicial de Gibson. Así, Simon y 
Feigenbaum (1964) desarrollaron el modelo EPAM que se asemeja al APA al de- 
sarrollar un sistema de discriminación o árbol de distribución durante su expe- 
riencia en el aprendizaje APA (véase el panel b de la figura 6.5). Cada nodo en el 
árbol formula una pregunta de prueba del estímulo (““¿La primera letra es Una 
()?"”), ésta va seguida de dos ramas (hacia nodos inferiores) que se tornan, depen- 
diendo del resultado de la prueba. Las respuestas se almacenan al pie del árbol de 
distribución y se recuperan y extraen cuando un estímulo se destina a esa termi- 
nal. Dos estímulos se confunden si se distribuyen a la misma terminal del árbol; 
pueden diferenciarse al crear un nuevo nodo de prueba basado en una caracterís- 
tica distintiva de uno de ellos y al hacerla entrar en el árbol. 

Los detalles del modelo EPAM y su sucesor el SAZ (Hintzman, 1968) se pre- 
sentan en el capítulo 12, que trata acerca de las teorías del procesamiento de in- 
formación. Por el momento, basta decir que éstos explican los tipos de datos or- 
denados para la teoría de Gibson, y esclarecen además muchos otros resultados. 
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Aprendizaje de respuesta 


El aprendizaje de respuesta se refiere a la adquisición de las “'respuestas”” nomi- 
nales como unidades asequibles de la memoria. En un experimento APÁ la res- 
puesta nominal puede ser una nueva cadena de elementos, como una sílaba sin 
sentido o un número de 3 dígitos, los cuales deben aprenderse como unidades, 
Generalmente, una gran parte de los errores en tales experimentos de sílabas sín 
sentido son fallas al responder, o versiones incompletas o mutiladas de los térmi- 
nos de respuesta apropiada. Así, en el aprendizaje de los pares 1-QHJ, 2-QX]J, y 
3-H]JX, la persona puede producir 1-Q/X, o 2-QHJ, y se registraría un error, Es 
evidente que el sujeto debe aprender diversas listas miniseriales en esa tarea (3, 
entonces H, entonces J, entonces X"”) y superar las confusiones y la interferencia 
entre ellas. 

El factor más potente que controla el aprendizaje de respuesta de las sílabas sin 
sentido es el grado en que se aproximen a las secuencias de letras familiares, es- 
pecíficamente a las palabras, Mientras más aspecto de palabra tenga un trigrama, 
o cuanto más cerca esté de igualarse con estadísticas de los vocablos reales del 
idioma más rápido se le aprenderá y se dará como una respuesta en APA. Si el su- 
jeto está de antemano familiarizado con un conjunto de sílabas sin sentido, su APA 
posterior se facilitará cuando esas unidades se usen como respuestas. Estos efec- 
tos del aprendizaje de reactivo ocurren no sólo en los pares asociados sino en el 
aprendizaje serial y en el de recuerdo libre. Los efectos del aprendizaje de res. 
puesta son comprensiblemente simples como tareas de aprendizaje serial en mi- 
niatura que están incrustadas dentro de la tarea general. 


Formación de asociación 


La formación de asociación se refiere a la conexión de los estímulos discri- 
minados con unidades de respuesta integradas. Este proceso ha sido tema de rmu- 
chas investigaciones. No lo examinaremos aquí, puesto que sólo se señalarán dos 
temas de investigación relacionados con la formación de asociación. 


Aprendizaje incremental versus aprendizaje de todo o nada 

Un primer tema se refiere al tiempo que insume la formación de una asociación 
durante sucesivos ensayos de práctica. Si pudieran efectuarse medicianes exactas 
de la probabilidad, en cada ensayo, de que un solo estímulo evoque la respuesta co- 
rrecta de un sujeto, ¿cómo sería esta curva de la probabilidad de respuesta cuando se 
trazara sobre ensayos sucesivos de práctica? ¿Se incrementaría gradualmente de 
ensayo a ensayo, o consistiría en uno o más saltos discretos desde un nivel de pro- 
babilidad a otro más alto, donde cada nivel se mantuviera durante varios ensayos? La 
respuesta no puede obtenerse directamente, ya que en un solo ensayo para un 
solo par E-R observamos un éxito o un error, pero ninguno de ellos proporciona 
bastante información como para inferir gran cosa acerca de la probabilidad subya- 
cente a la curva del aprendizaje. En consecuencia, esta cuestión se ha tratado de 
modo indirecto, mediante el examen de las implicaciones del punto de vista del 
incremento gradual versus la visión discontinua del todo o nada del aprendizaje. 
Hull y los investigadores del aprendizaje verbal generalmente han defendido la opi- 
nión del incremento gradual; Guthrie, Estes y los psicólogos de la Gestalt por 
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lo común se ha apegado a la visión discontinua del todo o nada, Para una reseña, 
consúltese a Restle (1965) o a Bower (19673). Por nuestra parte, examinaremos 
el tema con mayor detalle en el capítulo 8, que trata acerca de la teoría del mues- 
treo de estímulo. 


Mediadores 

Un segundo aspecto vinculado con la formación de asociación es el papel de los 
mediadores en la construcción de un puente desde el estímulo nominal a la res- 
puesta nominal. Un mediador es una parte de conocimiento o alguna asociación 
preexistente que el sujeto crea para que le ayude a aprender la asociación 4-R. 
Por ejemplo, para aprender el par RML-SOL el sujeto podría decir que usó la 
cadena R-rata-SOL o M-mala-SOL o £-luna-SOL. Tales mediadores (llamados 
también nemónicos) utilizan el conocimiento que posee una persona para encontrar 
un vínculo (véase la figura 6.6). Sabemos que los pares para los cuales el sujeto 
puede pensar en un nemónico, o para los cuales se proporciona uno, se aprenderán 
con más rapidez que los pares que carecen de él, El aprendizaje no sólo de pares aso- 
ciados sino también el de sílabas aisladas o de trigramas depende de que se activen 
asociaciones desviadas para los llamados mediadores naturales del lenguaje. Así, 
las sllabas sin sentido como LUV se recordarán como ““LOVE con un cambio de 
letras””, CAF como “*café sin la e*”, etcétera. 

Prytulak (1971) descubrió que las sílabas sin sentido podían puntuarse en 
términos de la facilidad para transformarlas en palabras familiares; además, esta 
medición de la facilidad de creación de palabra tenía una correlación muy alta con el 
recuerdo de las silabas sin sentido en la tareas de aprendizaje verbal. Los resulta- 
dos sugieren que los sujetos convierten una sílaba sin sentido en ““una palabra más 
una transformación””, almacenan este código en la memoria, y la decodifican en el 
momento del recuerdo. Si los sujetos recuerdan la palabra pero olvidan la natu- 
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raleza exacta de la transformación de decodificación, es posible que acierten entre 
decodificaciones plausibles durante la prueba. Ásí, podrían recordar LOV en vez 
de LUV, CFE en lugar de CAF. etcétera. Prytulak observó una elevada frecuencia de 
este tipo de errores, que serían el resultado de la decodificación incorrecta de una 
palabra mediadora. 

Se presume que estos mediadores ocurren debido a que es más fácil asimilar 
material nuevo «dentro de un contexto familiar más una corrección, que aprender 
las nuevas combinaciones desde el principio. De modo similar, cuando los adultos 
aprenden RML-5OL con el uso de las dos conexiones parcialmente familiares L-Luna 
y Luna-sOL (véase la figura 6.6), tal circunstancia nos dice que el aleccionamien- 
to, fortalecimiento y encadenamiento de las asociaciones antiguas son más eficien- 
tos para ellos que el aprendizaje directo de las asociaciones nuevas desde el 
principio. 

Si a los adultos se les pide que aprendan pares de palabras con significado (por 
ejemplo, perro-bicicleta), a menudo construirán una oración significativa que vincu- 
le alos dos conceptos en una interacción plausible y recordable (“'este perro mon- 
taba en una bicicleta”*). Tales mediadores mejoran el aprendizaje de pares asociados. 
Las oraciones de acción son mejores mediadores que las conjunciones simples 
(“perro y bicicleta van juntos”). Además, los sujetos también pueden visuali- 
Zar escenas imaginarias de la interacción, y esta visualización incrementa conside- 
rablemente la memoria de los pares. Los beneficios son un tanto mayores cuando 
los sujetos generan sus propias oraciones o imágenes en lugar de usar alguna que 
el experimentador les proporcione (Bobrow y Bower, 1969). Estas técnicas de 
generación de oración o de imagen y sus resultados sobre el recuerdo se examina- 
rán más adelante (capítulo 13). Constituyen las técnicas centrales del conjunto de 
dispositivos nemónicos que se han difundido en los cursos acerca del mejora- 
miento de la memoria (Lorayne y Lucas, 1974). 

Los dispositivos nemónicos constituyen estrategias para registrar deliberada- 
mente el material que ha de aprenderse, de una forma adecuada para ser asociada 
mediante conceptos familiares, generalmente con el uso de la imaginación visual. 
Estas técnicas son bastante efectivas (aunque no tanto como se les anuncia co- 
mercialmente), y se han investigado hasta cierto grado en situaciones de laboratorio 
(Bower, 1970a; Cermak, 1975). Los estudios acerca de los mediadores de imagi- 
nación y de oraciones en el aprendizaje por asociación se han amparado en las teo- 
rías del aprendizaje cognoscitivo, y serán analizadas en el capítulo 13, Al parecer 
están muy alejadas de la antigua concepción de que el aprendizaje de pares asocia- 
dos se refería al establecimiento de conexiones E-R mediante métodos análogos 
al condicionamiento clásico. Esa concepción se abandonó hace muchos años. 

Los temas que se verán a continuación conciemen a la ¿rarsferencia del enfrena- 
miento y al olvido (o retención). La transferencia del entrenamiento se refiere a los 
efectos del aprendizaje pasado sobre la velocidad en el aprendizaje de alguna tarea 
similar, a la cual se transfieren los hábitos anteriores. La transferencia puede ser 
positiva, negativa o neutral, y depende de la cantidad y del tipo de superposición 
en la estructura de las dos tareas. Como son dominios tan ricos en grandes efec- 
tos, los estudios de las leyes de la transferencia y del olvido en el aprendizaje ver- 
bal se han convertido en la actividad central y continua de los psicólogos funcio- 
nalistas. Por lo tanto, se examinarán más profundamente estas dos áreas de in- 
vestigación y se pondrá el acento en sus desarrollos históricos. 
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ESTUDIOS EN TORNO DE LA TRANSFERENCIA 
YEL OLVIDO 


Nuestra reseña histórica se inicia con un artículo de McGeoch (1932), que pro- 
porciona una explicación funcionabista inicial de las condiciones que afectan a la 
transferencia y al olvido de los materiales verbales. McGeoch aceptaba dos grandes 
leyes del olvido y de la transferencia, La primera es la Jey del contexto, que afirma 
que el grado de retención, medido por la ejecución, es una función de la similitud 
entre la situación original de aprendizaje y la situación de retención. La segunda es 
la ley de la inhibición proactiva y retroactiva, la cual sostiene que la retención es una 
función de las actividades que tienen lugar antes y después del aprendizaje ori- 
ginal. La inhibición proactiva y retroactiva fueron un tema central de investigación 
durante muchas décadas, desde que Muller y Pilzecker (1900) descubrieron el 
problema, 

El paradigma de la inhibición retruactiva es A, B, A, donde el aprendizaje del 
material B se interpola entre el aprendizaje y la retención del material A, e inter- 
fiere con la retención de A. El paradigma de la inhibición proactiva es B, 4, A, en 
el cual el aprendizaje de B antes del aprendizaje de Á interfiere con la retención 
posterior de A. Las interferencias proactiva y retroactiva con el aprendizaje son 
fácilmente demostrables, y las relaciones empíricas han originado un cierto 
número de hipótesis, Un examen del desarrollo de una de estas hipótesis acerca 
de la inhibición retroactiva nos ayudará a comprender no sólo la inhibición tetroac- 
tiva sino la manera en que los funcionalistas construyen sus teorías. 

Un conjunto de problemas se refiere a la similitud entre el material interpolado y 
el que se ha aprendido originalmente. Con base en algunos resultados de sus pra- 
pios trabajos y de los de Skaggs (1925), E.S, Robinson (1927) formuló una hipó- 
tesis a la que McGoech más tarde bautizó como la hipótesis Skaggs-Rahinson. 
Siguiendo a Skaggs, el citado investigador se propuso relacionar la cantidad de inhú- 
bición retroactiva con el grado de similitud entre el material o actividad original y el 
interpolado. 

Con la dimensión de similitud en mente, Robinson sostiene que la interpolación 
de material idéntico (el material B igual que el material A) sólo proporciona una 
práctica adicional en el material A, y por tanto conduce a uná mayor retención en 
los ensayos de prueba durante los cuales suele mostrarse la inhibición retroactiva. 
Como este tipo de inhibición con materiales diferentes ya era un hecho estable- 
cido, la conjetura natural es que al comenzar con identidad entre los dos mate- 
riales, la cantidad de inhibición retroactiva se incrementaría gradualmente a medi- 
da que aumentara la diferencia. Ahora bien, pregunta Robinson, ¿qué sucede en el 
otro extremo de la escala a medida que el material original (material A) y el mate- 
rial interpolado (B) se vuelven extremadamente diferentes? Es de suponer que la 
inhibición retroactiva representa algún tipo de interferencia basada en la semejan- 
zaentre la actividad original y la interpolada, si hay escasa similitud, debería haber 
muy poca inhibición retroactiva. Al reunir todas estas consideraciones, es razo- 
nable esperar un tnáximo de intúbición retroactiva en algún punto intermedio de si- 
militud entre los materiales A y B. Robinson formuló la generalización total en los 
siguientes términos: ''A medida que la simititud entre la interpolación y la memo- 
rización original se reduce a partir de una gran identidad, la retención disminuye 
hasta un mínimo, y entonces se eleva de nuevo, pero con la similitud decreciente 
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Figura 6.7. La similitud como un 
factor en la inhibición retroacti- 
va. La curva imtenta demostrar 
que la inhibición guarda una rela- 
ción cuantitativa con el grado de 
similitud existente entre ía activi 
dad interpolada y el material ori- 
ginalmente memorizado. Con el 
máximo de semejanza, la activi- 
dad interpolada genera transfe- 
rencia positiva y, por lo tanto, au- Similitud Similitud SImilitud 
menta la eficiencia del recuerdo. máxima media minima 
Se predice que el máximo de in- Grado de similitud entre la actividad interpolada 
terferencia con el recuerdo se y la memorización original 
produrira en algún valor interme- 

dio de la similitud (tomada de E. 

S. Robinson, 1927). 


Eficiencia del recuerdo 


nunca alcanza el nivel de obtención que logra con la similitud máxima”. La expre- 
sión de Robinson se ha vertido gráficamente en la fígura 6.7. 

Su propia prueba experimental de la generalización era muy simple. Mediante el 
método del abarcamiento de la memoria estudió el recuerdo de las primeras cua- 
tro de una serie de ocho consonantes cuando las últimas cuatro interferían en este 
recuerdo. Es decir, las primeras cuatro se consideraban como el material 4, las 
últimas como el B, y se controlaba la similitud y la disimilitud de los materiales A y 
B. La semejanza se definía en términos de letras comunes en las dos mitades de la 
serie. La similitud máxima significaba que las segundas cuatro consonantes eran 
exactamente las mismas en el mismo orden que las primeras cuatro; la disimilitud 
roáxima significaba que las últimas cuatro diferían de las primeras. 

Los resultados confirmaron la hipótesis sólo parcialmente. A partir de la ligera 
identidad, la inhibición retroactiva se incrementaba a medida que el material 
interpolado se hacía cada vez más diferente, circunstancia que era parte de la con- 
jetura. Pero la disminución en la cantidad de retroacción (aumento en el recuerdo) 
con la desigualdad máxima no pudo comprobarse, De hecho, con materiales total. 
mente distintos, la inhibición retroactiva se encontraba al máximo. 

Otros investigadores no tuvieron mejor suerte que Robinson en confirmar su 
curva de transferencia. Por cierto, los posteriores análisis de las tareas de apren- 
dizaje verbal comenzaron a descubrir diversas fuentes de '"similitud”* entre dos ta- 
reas, así como distintos tipos de semejanza. Por ejemplo, en el aprendizaje de pares 
asociados, las dos listas sucesivas de pares pueden esquematizarse como E,- 
R,, y entonces E,-R,; al menos dos fuentes de semejanza son la similitud de estí- 
mulo (de E, a E) y similitud de la respuesta (de R, a R,). Segundo, los tipos de 
semejanza pueden darse en términos de superposición de elementos comunes en 
sílabas sin sentido (por ejemplo, se dice que VAX y VAS son “formalmente simila- 
res”*), o en términos de significado semántico o asociativo de dos palabras (por 
ejemplo, exaltado es un tanto similar a divertido, es menos semejante a abatido, y 
lo contrario de tris?e). El reconocimiento de estas complejidades significaba la des- 
aparición de la hipótesis Skagys-Robinson. Al reseñar la historia de los estudios 
de transferencia y retroacción, Postman (1971, pág. 1083) afirma: 


Cap. 6. Aprendizaje humano por esociación 189 


Retrospectivamente se hace evidente que ta hipótesis Skaggs-Rohinson fracasó debido 
2 que en esencia era una formulación no analítica, que no especificaba el lugar de la similitud 
intertarea. La hipótesis cayó en desuzo cuando el análisis de las relaciones de similitud en 
la retroacción, así como en la transferencia, se cambió por la investigación de las funcio- 
nes del estimulo y la respuesta. 


Osgood (1949) propuso una formulación más compleja de las relaciones que in- 
tervienen en la transferencia. Su diagrama propuesto de los efectos de la similitud 
de la transferencia en los pares asociados puede observarse la superficie tridimen- 
sional de la figura 6.8. Lo que la superficie de Osgood estipula es que la cantidad 
de transferencia en dirección positiva o negativa es una función de los cambios en 
similitud tanto de las condiciones de estímulo como de la respuesta requerida. Los 
cambios en la similitud del estímulo van desde el frente hasta el fondo, como se 
hace notar en el margen derecho, a) moverse de estímulos idénticos (£,) y a tra- 
vés de estímulos similares (E,) hasta estímulos neutrales (£,), que están muy dis- 
tantes en un gradiente de generalización. Los cambios en la semejanza de la 
yespuesta se representan de izquierda a derecha, como se ve a lo largo del mar- 
gen posterior, con las respuestas idénticas (R,) a la izquierda, y que se mueven 
progreswamente a través de respuestas similares (Rs); les respuestas neutrales 
(Ry), las respuestas parcialmente opuestas (R, hasta las respuestas directas an- 
tagóvicas (R,). Para materiales verbales significativos, la “respuesta antagónica'* 
se definía como la antónima, una palabra que posee el significado opuesto (por 
ejemplo, exaltado-triste). 


Figura 6.8. Superficie de transferencia v retroacción de Qsgood. La dimensión verti- 
cal, cantidad de transferencia (+) o de interferencia (—), y la zona neutral se repre- 
senta con un plano (0) De izquierda a derecha, cantidad de cambio en la similitud 
de la respuesta entre la tarea original y la nueva, desde la identidad (KR ,) hasta el ap- 
tagonismo (£,) Del frente hacía el fondo, cantidad de cambio en la simititud del esti- 
muló en la tarea original y en la nueva, desde la identidad (£/) hasta la neutralidad 
(Fa) [tomada de Osgoad, 1949) 
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CUADRO 6.1. Materiales de pares asociados que ilustran diferentes relaciones entre 
a ser aprendida, En cada par, la palabra de indicio que se emplea para 


A=>B A=>D CB c>D 
perro —altiler perra —zapato tarjeta alfiler tarjeta —zapato 
taza —estera taza árbol libro —estera libro —árbol 


escritorio cielo escritorio»alfombra autómovil=cielo autómovil alfombra 


La mejor forma de leer el diagrama consiste en empezar por sus bordes. El bor- 
de posterior indica que los estímulos que *o tienen ninguna semejanza con 
aquellos utilizados en el aprendizaje original no dan lugar a ningún efecto de trans- 
ferencia, positivo o negativa, independientemente del grado de similitud entre las 
respuestas requeridas y las respuestas que se han usado con anterioridad en otros 
experimentos. El borde frontal señala que con estímulos ¡dénticos habrá una trans- 
ferencia positiva máxima con respuestas idénticas (ya que esto es tan sólo un 
sobreaprendizaje); mientras que con respuestas directamente antagónicas (de 
significado opuesto) habrá una interferencia máxima, ya que las respuestas ante- 
riores tendrán que ser completamente desaprendidas o vencidas. El borde iz- 
quierdo indica que con respuestas idénticas, los cambios en la similitud de 
estímulo desde la identidad hasta la neutralidad darán lugar a una disminución de la 
transferencia, pero no interferirán en un aprendizaje nuevo, El burde derecho se- 
ñala que para las respuestas antagónicas, los cambias en la similitud de) estímulo 
desde la identidad hasta la neutralidad producirán una disminución de la transfe- 
rencia, pero ninguna transferencia positiva. El diagrama es una superficie y produ- 
ce una curva en cualquier lugar donde la corte un plano vertical. 

Aunque la superficie de Osgood representó un importante esfuerzo sistemático 
por integrar una gran extensión de fenómenos de transferencia y de retroacción, 
muy pronto se hizo evidente que era inadecuada por varias razones. En primer 
término, nunca hubo evidencia firme de que las respuestas antagónicas estuvieran 
asociadas con más transferencia negativa que las respuestas no relacionadas, 
incluso en los propios datos de Osgood. Segundo, aunque los datos del aprendizaje 
verbal proporcionan pruebas de diferencias en transferencia entre estímulos idén- 
ticos, similares y no relacionados, no demuestran un gradiente contisruo de efectos 
conforme se varía la similitud sobre el rango intermedio (véase Postman, 1971, 
pág. 1054), Desde luego, este efecto graduado está implícito en el suave traza de 
las curvas, En tercer lugar, la superficie implica que la transferencia siempre será 
de cero cuando se usen estímulos no relacionados en tareas sucesivas (obsérvese 
el borde posterior de la superficie en la figura 6.8). Sin embargo, trabajos subsi- 
guientes demuestran que este arreglo produce transferencia positiva cuando el 
mismo término de la respuesta es nuevo y requiere de mucho aprendizaje. Por 
ejemplo, a fin de que el sujeto recite sílabas sin sentido como respuestas a 
estímulos neutrales se requiere que esas sílabas se aprendan como unidades de 
respuesta integrada per se. Así, un diseño de transferencia como 4-B, C-B 
(estímulos disímiles, respuestas idénticas) evita la necesidad de aprender les res. 
puestas de la segunda lista, y por ello puede producir transferencia positiva de es- 
ta manera. (Para mantener en orden los diversos diseños de transferencia, véanse 
las ilustraciones del cuadro 6.1). 

Una cuarta complicación con la superficie de Osgood es que en algunos experi- 
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una lista aprendida originalmente (4-8) en el extremo izquierdo, y una lista interpolada 
instigar el recuerdo está a la izquierda. 


B>D A =>8r 
alfiler-> zapato perro cielo 
estera árbol taza alfiler 


cielo alfombra  escritorio=estera 


mentos en los que se utilizó un diseño como A-B, B-D (la respuesta en la primera 
lista sirve como estímulo en la segunda) se hizo evidente que se establecía una 
asociación hacia atrás (desde B hasta A) al mismo tiempo que la persona aprendía 
la asociación hacia adelante (de A a B). Esta asociación hacia atrás interfiere y ori- 
gina la transferencia negativa en el paradigma A-B, B-D, aunque causa transferen- 
cía positiva en el diseño 4-B, B-A (sólo invertimos los reactivos que sirven como 
indicios y Jos que actúan como respuestas). Como un quinto problema, las rela- 
ciones de similitud que se tratan en la superficie de Osgood se refieren a rela- 
ciones entre reactivos individuales (pares) a través de listas sucesivas, y no a las 
relaciones estructurales globales entre listas sucesivas, Pero se sabe que el ma- 
yor grado de transferencia negativa en el aprendizaje verbal se produce cuando los 
estímulos y las respuestas de la primera lista sencillamente se vuelven a parear de 
nuevas formas para componer los reactivos de la segunda lista. En notación simbó- 
lica, esto se designa como paradigma A-B, A-Br (obsérvese la última columna del 
cuadro 6.1). Dentro de la estructura de la superficie de Osgood, esta condición A- 
Br tnicamente puede representarse como A-B, A-D con estímulos idénticos y 
respuestas diferentes. De todas maneras, el paradigma A-Br produce mayor 
transferencia negativa (debido en gran parte a la competición de las asociaciones 
hacia atrás) que el diseño A-D. 

Como una sexta y última complicación, la superficie de Osgood implica que la 
transferencia negativa en la tasa del aprendizaje de una segunda lista se 
correlacionaría a la perfección con la cantidad de olvido (interferencia retroactiva) 
de la primera lista, causada por el aprendizaje del sujeto en la segunda. Aunque es- 
tas dos mediciones frecuentemente están correlacionadas, en la actualidad se co- 
nocen algunos casos de discrepancia. Una de ellas es que mientras A-B, C-D 
(estímulos y respuestas no relacionados) sirven como línea base para definir la 
transferencia cero en el aprendizaje de la segunda lista, es claro que Ja interpola- 
ción C-D eausa una extensión en el olvido de A-B (o interferencia no específica) 
según los resultados de Newton y Wickens (1956). El olvido de A-B pot parte de 
los sujetos en la lista C-D es bastante grande en comparación con el de los sujetos 
control que aprenden A-B, y sencillamente descansan durante un intervalo apro- 
piado antes de una prueba de retención. Por lo tanto, al adoptar la nea base C-D 
k condición C-D produce una transferencia negativa de cero, pero una conside- 
rable interferencia retroactiva. De hecho, esta observación es una de las razones 
que motivaron las recientes dudas acerca de la existencia de interferencia retroac- 
tiva específica para estímulos particulares de pares asociados (véase Postman y 
Stark, 1969). 

Resulta claro que la transferencia en los pares asociados no es un proceso unitario, 
sino que más bien incluye un número de componentes distintos Que intervienen 
durante el aprendizaje inicial y la comprobación de transferencia, Conforme se 
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varía la similitud del estímulo o de la respuesta, cambian diferentes aspectos o 
componentes de la tarea de transferencia, aunque el esfuerzo neto sobre la ejecu- 
ción tal vez no sea claro porque los distintos componentes contribuyen con efectos 
positivos o negativos, que pueden cancelarse o nulificarse entre sí. Martin (1965) 
publicó un trabajo mejor informado relacionado con su intento de especificar su- 
perfcies de transferencia para tres componentes diferentes que se acarrean en la 
transferencia Jo cua] se muestra en la figura 6.9. Los tres componentes considera- 
dos son el aprendizaje de la respuesta (R, en el cuadro de la izquierda), aso- 
ciaciones progresivas (F, en el cuadro medio), y asociaciones retrospectivas (B, 
en el cuadro derecho). Para el aprendizaje de la respuesta, el grado de transferen- 
cia positiva es alto para respuestas idénticas, disminuye hacia cero para las res- 
puestas más disímiles, y es independiente, por supuesto, de la semejanza del 
estímulo. La superfície para las asociaciones progresivas (F) es la misma que vi- 
mos en Osgoud, excepto que Martin sugiere que el continuo de respuesta debería 
extenderse sólo a las respuestas no relacionadas (4-B, A-D). Aunque los antóni- 
mos sean opuestos en significado, son asociativamente cercanos entre sí y esta 
relación, más que su significado opuesto, es tan dominante que produce una trans- 
ferencia ligeramente positiva cuando se usan respuestas antónimas (Postman, 
1971). Los resultados para las asociaciones hacia atrás (B) son hastante simétri- 
cas con aquellos que corresponden a las asociaciones hacia adelante, salvo por un 
intercambio de ejes de estímulo y respuesta. En particular, la interpolación de C- 
Ba continuación del aprendizaje A-B produce una pérdida máxima de la asociación 
hacia atrás desde B hasta A, como lo indica la falla del sujeto para recordar el 
estímulo A de la primera lista cuando se le pregunta con el término de respuesta B. 

La hipótesis de Martin no indica específicamente de qué manera se combinan 
estos diversos factores para determinar el efecto de transferencia neta. También 
aparece claramente que incluso se han identificado otros factores que pueden 
influir en la transferencia y en el olvido, y estas características no se describen en 
las superficies de Martin. Así, por ejemplo, en varios experimentos se ha de- 
mostrado que hay algunos beneficios positivas en la atenta exposición previa a los 
términos de estímulo o de respuesta, ya que esto sirve para “prediferenciar” 
esos reactivos antes del inicio de la tarea criterio de pares asociados. Según el 


Figura 6.9. Superficies componentes para la disponibilidad de la respuesta (R), aso- 
ciaciones progresivas (F), y asociaciones retrospectivas (8), El grado de similitud del 
estimulo se espacia a lo largo del eje X;, y el grado de similitud de la respuesta a lo 
largo del eje Xg. Fl punto de origen representa la identidad del estímulo y de la res- 
puesta. La dirección y el grado de transferencia se indican a lo largo del eje vertical 
(tomada de E. Martin, 1965). 
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grado en que el sujeto haya aprendido a identificar y discriminar entre los 
estímulos, le será mucho más fácil continuar discriminando mientras vincula res- 
puestas particulares a los estímulos prediferenciados. Aunque el paradigma nor- 
mal 4-B, A-D implica este factor de prediferenciación, el factor de respuesta com- 
petitiva a parecer lo pasa por alto y determina la transferencia negativa neta en la 
mayor parte de las circunstancias. 

Otro factor ausente en esta superficie de transferencia es lo que se ha denomi- 
nado diferenciación de la lista, la habilidad del sujeto para identificar la pertenencia 
de lista de las respuestas que recuerda. Así, durante el aprendizaje A-D después 
de A-B, la persona puede introducir la respuesta B aunque conozca ambas res- 
puestas, porque confunde las dos listas. O tal vez piense en la respuesta D, pero 
la contenga al identificarla erróneamente como proveniente de la primera lista, De 
modo similar, después de la interpolación de A-D, si se le pide a la persona que 
recuerde la respuesta de la primera lista, es posible que contenga B, o introduzca 
D si es incapaz de distinguir en qué lista ocurrían las diversas respuestas. La dife- 
renciación de lista como proceso es muy análoga al recuerdo del momento y el 
contexto en donde ocurren los eventos, un tema que resiste sumo interés (Ander- 
son y Bower, 19724; Hinrichs, 1970; G. H. Bower, 19724. La identificación de lis- 
ta es claramente un factor en la transferencia, ya que las confusiones acerca de la 
pertenencia de lista se incrementan con la similitud de los estímulos o las respues- 
tas. Así, por ejemplo, si las respuestas de la lista 2 son dígitos mientras que las de 
la lista 1 son sustantivos, tal vez habrá una diferenciación perfecta de hsta, y el su- 
jeto casi nunca introduciría una respuesta de dígito mientras intentase recordar un 
sustantivo de la lista 1. 

La hipótesis de Martin abarca la transferencia negativa masiva producida por la 
tarea de transferencia A-Br repareada, ya que en la figura 6.9 se rmuestra transíe- 
rencia negativa para la asociación hacia adelante (en A-D en el cuadro medio) y 
transferencia negativa para la asociación hacia atrás (en C-B en el cuadro de la de- 
recha). Lo que no logra mostrar es que el paradigma A-B, C-D produce transfe- 
rencia negativa cero, no obstante un olvido considerable relativo a la condición de 
descanso en el grupo control. Más adelante retomaremos aspectos centrales de 
este tema, 

Ahora es posible reconstruir la evolución de estas hipótesis (o supuestas *“ge- 
neralizaciones empíricas”) acerca de los efectos de la similitud en la retroacción 
y en la transferencia. En primer lugar, contamos con los experimentos iniciales 
que demuestran la interferencia retroactiva, y algunos que comprobaron el po- 
sible papel de la similitud como factor. Después está la hipótesis dimensional un 
tanto burda de Robinson, que conduce a una serie de experimentos que revelan 
fuentes y tipos múltiples de similitudes intertarea, que requieren de una generali- 
zación más compleja que la hipótesis de Skaggs-Robinson. Al mismo tiempo que 
se realizaban estas investigaciones acerca del olvido, se levaban a cabo una serie 
de experimentos relacionados sobre la transferencia, pero como si los dos fenó- 
menos tuvieran poco en común. Osgood presentó su nueva hipótesis, que cubría 
los datos acumulados desde la hipótesis de Robinson, e incorporó los resultados 
de la transferencia y la interferencia retroactiva. Pero una serie de estudios 
analíticos revelaron que la superficie de Osgood era demasiado simplista, que hay 
incluso más componentes o factores independientes implicados en la transferen- 
cia. Estos análisis detallados llevaron a Martin a proponer superficies de tranmsfe- 
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rencia componente para tres de los aspectos importantes del aprendizaje que ahora 
se sabe se acarrean en la transferencia. Aunque las propuestas de Martin constitu- 
yen las síntesis más adecuadas e integradas conocidas hasta la fecha, es evidente 
que todavía se ignoran diversos factores aislables, y que queda por especificar la 
asignación de valores a la magnitud los factores independientes y sus interac- 
ciones en la determinación de la transferencia neta. Este tipo de sucesión de gene- 
ralizaciones conjeturadas con una interacción entre los datos, la crítica analítica y 
la teoría, en busca de un análisis más profundo y de tuna integración más revelado- 
ra, es exactamente lo que cabría esperar en un análisis funcional maduro. Esta his- 
toria también ilustra algunas de las potenciales frustraciones de un enfoque fun- 
cionalista; con un análisis más profundo se descubren más y más variables o facto- 
res independientes que inciden en la conducta motivo de investigación, y la posibi- 
lidad de fuertes interacciones entre una variable y las funciones obtenidas para 
otras variables es una expectativa probable. Por ejemplo, la función de transferen- 
cia relacionada con la similitud de la respuesta quizá varíe de forma cuantitativa, 
dependiendo de que tratemos con '“similitud formal'* (supetposición de elementos 
de materiales sin sentido) o con **similitud significativa”” (por ejemplo, palabras si- 
nónimas); y todavía no está claro si la segunda variable debe sujetarse a la super- 
posición conceptual de las definiciones de diccionario de dos palabras, o a la superpo- 
sición de las jerarquías asociativas provocadas por cada palabra (Deese, 1965). 

Las complejidades del fenómeno conductual de la transferencia provocan el des- 
aliento de algunos investigadores en psicología (por ejemplo, decir “la naturaleza 
no podría ser eso tan complicado'”), hacen que la abandonen como una pregunta 
científica mal formulada, y que se dediquen al estudio de otros temas con mayo- 
res posibilidades de rápido progreso. El funcionalista intransigente argumentaría 
que sólo se esforzaba por dilucidar un fenómeno, y clamaría que nadie tiene la sen- 
cillez garantizada en sus resultados y que, aunque los subproblemas cambian con 
la madurez de su análisis, el fenómeno dominante con el cual el área comenzó (es 
decir, la transferencia del entretiamiento) es sin duda un problema central para la 
teoría del aprendizaje, Si en verdad lo es —diría el funcionalista— se le debe estu- 
diár, analizar y comprender con las únicas herramientas experimentales y concep- 
tuales de que disponemos en la actualidad. Debemos analizar y comprender ta 
complejidad porque *“así es el mundo”*. 


Análisis del olvido 


La exposición que realizamos en torno de la investigación acerca de la transte- 
rencia negativa y la imerferencia retroactiva se centró en el nivel de la descripción 
y la generalización empíricas, sin prestar demasiada atención a la teoría. Sin em- 
bargo, la porción más importante de la investigación de los funcionalistas moder- 
nos se refiere al análisis teórico de los mecanismos del olvido. El carácter del en- 
foque teórico funcionalista tal vez se aprecie mejor al trazar la evolución de sus 
ideas acerca del olvido. Gran parte de estas investigaciones se efectuaron con 
base en experimentos de aprendizaje verbal con adultos humanos. Por supuesto, 
los animales también olvidan, incluso las respuestas condicionadas simples, y el 
estudio del olvido en éstos se ha convertido en un área central de investigación 
(Honig y James, 1971; Spear, 1978). A fin de reducir la dificultad de la tarea de 
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comprensión, los experimentos recientes acerca del olvido se concentran en si- 
tuaciones de aprendizaje verbal estándar para producir la evidencia fundamental. 

Si preguntamos al lego por qué olvida ciertas cosas, presentará una rápida res- 
puesta: las olvida porque no las ha usado, o no ha pensado en ellas durante algún 
tiempo. Ha olvidado el inglés que aprendió en la preparatoria porque no lo ha prac- 
ticado en el transcurso de los últimos diez años. Pero recuerda palabras que conti- 
núa usando, como los nombres de sus amigos. 

El problema de esta explicación es que no satistace la curiosidad del científico 
acerca de los mecanismos causales. El paso del tiempo no es en sí mismo una va- 
nrable causal, aunque los eventos causales sucedan en el tiempo. Si dejamos un 
martillo a la intemperie, finalmente, se oxidará. Pero no es el paso del tiempo el 
que la oxida, sino que es la reacción de la oxidacción química la que se produce con 
el tiempo. 

La propuesta del lego puede traducisse con un sosido más neurológico (o un 
sentido) de la forma siguiente: cada experiencia de aprendizaje establece una hue- 
Da neurológica cuya integridad es gradualmente obliterada por el ruido neuronal 
aleatorio que ocurre a una tasa fija, y desgasta la recuperabilidad de la huella de 
memoria a medida que se incrementa el intervalo de retención. ¿Nos dice algo 
esta formulación? La respuesta es “'no””. Á no ser que se agregue mucho más 
acerca de las variables pertinentes y su influencia sobre el hipotético proceso (y el 
olvido), la nueva propuesta es más que vacía: es peligrosa, porque probablemente 
alguien la considere con seriedad debido a su aparente jerga técnica. 

Existen diversas propuestas sustantivas acerca de las causas del olvido, que di- 
feren considerablemente en su alcance y en la extensión de variables de las cuales 
se dice que el olvido es una función. Por ejemplo, Freud suponía que parte del ol- 
vido es resultado de la activa represión de ciertos materiales en el inconsciente, 
Una discusión crítica de esta hipótesis, junto con los datos conflictivos que la ro- 
dean, se encuentra en una edición anterior de este libro (Higard y Bower, 1975); 
para una versión favorable de esa conflictiva bibliografía, consúltese a Erdelyi y 
Goldberg (1979). 

Otra conjetuta, presentada por los psicólogos de la Gestalt y que veremos en el 
capítulo 10, es que las memorias son sistemas multifacéticos que continuamente 
sufren cambios dinámicos, y se mueven hacia alguna organización mejor (o Ges- 
tal). En los experimentos de laboratorio esta noción se ha traducido en la pregun- 
ta de si el recuerdo que tiene un sujeto de una figura o un dibujo lineal asimétrico o 
incompleto tiende a moverse durante un intervalo de retención hacia una figura 
Gestalt “'buena”” o “mejor”, En su reseña de esta abundante bibliografía, Riley 
(1963), concluye que existe muy poco apoyo consistente para la idea de la Gestalt. 
El recuerdo de un patrón de figura tiende más frecuentemente a moverse hacia 
estereotipos culturales, pero las tendencias descubiertas resultan explicables 
más a menudo mediante las asociaciones verbales (a la figura original) o la in- 
terferencia proactiva desde el aprendizaje cultural previo, que a partir de las leyes 
Gestalt de la organización perceptual. 

La teoría más útil del olvido que ha surgido de los experimentos en el laboratorio 
es la lamada de la interferencia, estrechamente vinculada con el análisis funciona- 
lista de Ja transferencia negativa y la interferencia. En la actualidad tiene muchos 
más adeptos, debido a que existe más evidencia en su favor que hacia cualquiera 
de las teorías alternativas del olvido, por lo que es justo considerarla corno domi- 
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nante en los experimentos relacionados con dicho fenómeno. Se trata de una teo- 
ría de asociación; es decir, su concepto primitivo básico es la noción de un vínculo 
asociativo (conexión funcional) entre dos o más elementos, que pueden ser ideas, 
palabras, estímulos y respuestas de situación, etcétera. Como hemos señalado al 
tratar acerca de los paradigmas de transferencia, la notación convencional emplea 
las letras A, B, €... para representar tales elementos o reactivos, y la notación 
A-B para un vínculo asociativo entre A y B, establecido por algún entrenamiento 
pasado. Se supone que estos vínculos asociativos varían considerablemente en 
fuerza, dependiendo de la cantidad de práctica. La situación experimental que me- 
jor ilustra a esta teoría es el aprendizaje de pares asociados, en el cual se enseña al 
sujeto un conjunto (lista) de pares y posteriormente se comprueba su retención de 
los mismos. La teoría también se aplica a muchas otras tareas de aprendizaje, 
pero la de pares asociados hace que el mecanismo de exposición sea más fácil de 
poner en marcha. 


Teoría de la interferencia 


Las ideas básicas de la teoría de la interferencia fueron estipulados explícita- 
mente por vez primera por McGeoch (1932), pero durante los años subsiguientes 
se produjeron cambios graduales en ella. Se han agregado nuevos conceptos, las 
hipótesis carentes de apoyo se han descartado, y se diseñaron nuevos métodos ex- 
perimentales para medir con mayor exactitud las variables dependientes relevan- 
tes. El carácter cambiante de la teoría de la interferencia se observa al comparar 
las primeras declaraciones de McGeoch con las formulaciones posteriores de 
Postman (1961, 1971). A continuación señalaremos algunas de las modificaciones 
más significativas. 

El primer principio de la posición de McGeoch parece absurdo para una teoría 
del olvido: afirma que éste no ocurre en un sentido absoluto. La fuerza de una aso- 
ciación entre dos reactivos A-B se establece mediante el entrenamiento, y su- 
puestamente permanece en ese nivel a pesar de la falta de uso de la asociación. La 
causa de una pérdida mensurable de retención con el paso del tiempo no es la dis- 
minución de la fuerza de A-B, sino más bien que las asociaciones alternativas A-C 
o A-D han ganado fuerza a través de algunos medios no especificados, en ausencia 
del entrenamiento continuo en A-B. Así, en una prueba de retención el sujeto puede 
dar C o D como asociación para A, de modo que registramos una pérdida de 
retención para la asociación A-B. Ésta no se ha perdido ni olvidado en un sentido ab- 
soluto; todavía permanece en la memoria, pero B ha sido temporalmente despla- 
zada, y ha quedado atrás en la competencia con los elementos € y D en el momen- 
to del recuerdo. 

Con base en esta teoría, una asociación aprendida se almacena permanentemen- 
te, y el olvido se debe a la disponibilidad disminuida, una menor probabilidad de su 
recuperación. Y esta disponibilidad disminuida es el resultado de asociaciones 
competidoras. Tal enfoque tiene al menos el sustrato requerido para explicar los 
casos clínicamente enigmáticos de hipermnesia, en los cuales una persona mues- 
tra un recuerdo excepcional —o cree que su recuerdo es genuino— de experien- 
cias vividas mucho tiempo atrás. Ese recuerdo tan incrementado puede ocurrir en 
estados maniacos, en las horas previas a un suceso emocionalmente excitante (por 
ejemplo, en los soldados a punto de entrar en combate), en un trance hipnótico 
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(véase Reiff y Scheerer, 1959), o mientras se sigue una línea de asociaciones libres 
en el diván del psicoanalista (Erdelyj y Kleinbard, 1978; Pascal, 1949; Stratton, 
1919; Stalnaker y Riddle, 1932). 

De acuerdo con esta teoría, la asociación A-B se comprueba al presentar uno de 
los elementos, por ejemplo 4, sobre el cual el sujeto intenta producir el B asocia- 
do. Cabe pensar en A como un término de estímulo y en B como una respuesta. 
Como hemos señalado en nuestra revisión acerca de la transferencia, esto sugiere 
la manipulación del grado de similitud entre un estímulo de prueba (llamado A *) y el 
estimulo de entrenamiento original A. El principio de la generalización del estímulo 
predice que A' tiene menos probabilidades de activar la asociación A-B en la pro- 
porción en que A' es disfmil de A. Además, McGeoch sugiere que ampliemos 
nuestra concepción de A para incluir cualquier estimulación contextual de fondo 
que esté presente cuando se aprenda la asociación A-B. Se ha descubierto que los 
cambios en tales estímulos contextuales dan lugar a un recuerdo más pobre (Al- 
bernathy, 1940; Falkenberg, 1972; Pan, 1926). Así, si se somete al sujeto a una 
prueba de recuerdo en una habitación distinta de aquella en la cual aprendió, con 
un tipo diferente de dispositivo de presentación de estímulo, con el material pre- 
sentado con diversos marcos de referencia, o cuando adopte una postura distinta, 
su recuerdo es más pobre que si durante la prueba se reproduce exactamente el 
contexto de la estimulación original, Tales resultados parecen congruentes con la 
posición analítica de la teoría de la interferencia. 

Hemos visto que la pérdida de retención de una asociación A-B aprendida es el 
resultado de la competencia de asociaciones alternativas 4-C en el momento del 
recuerdo. Si nos preguntamos de dónde provienen conflictivas asociaciones, la 
respuesta lógica es que ellas (o tna similar, A'-C) proceden del aprendizaje ya sea 
antes o después del aprendizaje A-B, pero previamente a la prueba de retención. 
Este análisis condujo a la investigación intensiva de situaciones en las cuales el 
aprendizaje A-B y A-C se controla de forma explícita. Los dos paradigmas básicos 
se denominan retroacción o proacción, lo cual depende de si el interés del expe- 
rimentador se inclina por la retención del material que se ha aprendido primero o 
por el aprendido en segundo lugar. Estos paradigmas, junto con las condiciones 
apropiadas de control y algunos datos hipotéticos del recuerdo, se ilustran en la 
tabla 6.1. En el paradigma de retroacción, el grupo control aprende las asociaciones 
A-B, y luego descansa. Después se le somete a prueba de recuerdo de B cuando 
se da el término A. El grupo experimental aprende A-B, posteriormente aprende 
nuevos pares A'-C, y después intenta recordar B cuando se da A. El índice de inter- 
ferencia retroactiva calculado para los datos hipotéticos es de 67%. Las condicio- 
nes de proacción se leen de modo similar. 

En este contexto puede estudiarse una diversidad de variables de la tarea, y en 
general los resultados del recuerdo armonizan con lo que cabría esperar de la teo- 
ría de la interferencia (para reseñas, véanse Slamecka y Ceraso, 1960; Postman, 
1971). Por ejemplo, la interferencia retroactiva se incrementa con los ensayos 
sobre 4-C y disminuye con los ensayos en A-B, mientras que la interferencia pro- 
activa muestra exactamente las relaciones funcionales opuestas, como era de es- 
perar. Considérese un ejemplo, el efecto del número de ensayos de entrenamien- 
to en la lista A-B (aprendizaje original, abreviado AO) antes del entrenamiento A- 
C, sobre el predominio relativo de las asociaciones A-B y A-C. Un experimento 
de Briggs (1957) ilustra el procedimiento y los resultados (véase la figura 6.10). 
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TABLA 6.1. Resultados de recuerdo para ifustrar el olvido debido a la 
interferencia retroactiva y proactiva. 


Retroacción Proacción 


Experimenta! Contro! Experimental Contro! 


Lista 1 A-B A-B ALC descanso 
Lista 2 AC descanso  A-B A-8 
Prueba de recuerdo A-B A-B A-B A-B 
Porcentaje de recuerdo 

correcto 20 60 6U 80 
Efecto > = 0.67 9060 025 


Cuatro diferentes grupos de sujetos recibieron 2, 5, 10 o 20 ensayos del aprendi- 
zaje A-B, seguidos de 20 ensayos del aprendizaje A-C. Las listas consistían en 
diez pares de adjetivos. Después de intervalos de 0, 2, 5, 10 y 20 ensayos de 
aprendizaje A-C, cada sujeto recibe una prueba modificada de recuerdo libre con 


> 


Número promedio de respuestas 


a 


Número de ensayos A-C 


Figura 6.10. Frecuencias de respuesta relativa de la respuesta originalmente aprendi- 
da (A-B) y de la respuesta recientemente aprendida (A-C) durante el aprendizaje de la 
nueva respuesta, medidas por la prueba modificada de recuerdo libre. Las cuatro grá- 
ficas provienen de cuatro diferentes grupos de sujetos que tuvieran 2, 5,100 20 ensa- 
yos de aprendizaje original (tomada de Briggs, 1957) 
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los términos de estímulo, En tales pruebas se les instruye para que den la res- 
puesta que primero les venga a la mente (incluyendo intromisiones ajenas a la lis- 
ta), y el experimentador no proporciona retroalimentación que indique qué res- 
puesta se quiere. Esa prueba evalúa el predominio relativo de A-C sobre A-B. 

Las curvas que aparecen en la figura 6.10 constituyen una descripción gráfica de 
la frecuencia de la nueva respuesta C y de la antigua respuesta B, después de va- 
rar los números de ensayos de A-B y A-C. Al comienzo del aprendizaje de la se- 
gunda lista, la frecuencia del recuerdo de B depende directamente del número de 
ensayos de AO. Durante el curso del entrenamiento A-C, las respuestas B dismi- 
nuyen en frecuencia, mientras que las C aumentan hasta un nivel dominante. Des- 
pués de 20 ensayos 4-C, la cantidad de AO todavía ejerce cierta influencia, tanto 
en términos de una frecuencia superior de recuerdo de A-B como de una fre- 
cuencia menor de recuerdo de A-C. Este cuadro es exactamente el que cabría es- 
perar según las ideas iniciales de McGeoch acerca de la competencia de la res- 
puesta, ya que la prueba modificada de recuerdo libre sólo permite una respuesta. 

Las hipótesis de McGeoch predicen una correlación perfecta entre la pérdida de 
retención de A-B y la ocurrencia en la prueba de asociaciones ajenas, C o D, No 
siempre se encuentra esta correlación: en la prueba de retención A-B a continua- 
ción del aprendizaje A-C, el sujeto a menudo es incapaz de responder con alguna 
asociación. Para explicar el fenómeno se propusieron dos tripótesis, y es probable 
que ambas tengan cierta validez. Una noción que ya hemos mencionado, propues- 
ta por Thune y Underwood (1943), es que el sujeto puede discriminar la pertenen- 
cia de la lista (primera o segunda) de las asociaciones que le vienen a la mente; se- 
gún el grado en que lo haga, censurará y rechazará la respuesta C cuando intente 
recordar la respuesta de la primera lista, B. Esto es plausible, ya que se sabe 
(Yntema y Trask, 1963) que los sujetos juzgan con bastante exactitud cuál de dos 
eventos ha ocurrido más recientemente en el pasado. Otra idea, que Melton e 
Irwin (1940) expresaron por primera vez, es que durante el aprendizaje interpo- 
lado A-C, el primer par A-B se desaprende o se extingue. De ser así, cuando la 
prueba ocurra muy próxima al aprendizaje A-C, B será temporalmente inasequible 
como asociación. 

La evidencia más clara del desaprendizaje proviene de un método de recuerdo 
que (Barnes y Underwood (1959) utilizaron por primera vez. Con el empleo del 
paradigma A-B, A-C, en la prueba posterior se pedía at sujeto que recordara am- 
bas respuestas de lista al estímulo A, e indicara la pertenencia de lista de éstas. La 
gue ejemplificamos es una situación de recuerdo no competitiva, y las fallas se 
atribuyen a la inasequibilidad de las respuestas. Los resultados de Barnes y Un- 
derwood se muestran en la figura 6.11. En ella se observa que el recuerdo de tas 
respuestas € se incrementa con los ensayos del aprendizaje A-C pero, aún más 
importante, el recuerdo de las respuestas B disminuye con los ensayos en A-C. 
Así, a medida que se extiende el entrenamiento A-C, las asociaciones de la prime- 
ra lista se vuelven cada vez más inasequibles, quizá debido al desaprendizaje. Una 
variedad de experimentos de seguimiento confirmó y amplió estos resultados, de 
modo que el concepto de desaprendizaje gozó de una aceptación general. 

Postman y Stark (1969) pusieron en duda la validez del concepto de desaprendi- 
zaje de asociación. Observaron que el paradigma A-B, A-C producía relativa- 
mente poca transferencia negativa cuando sometieron a prueba al par A-B me- 
diante el reconocimiento de elección múltiple (es decir, reconocer que B, pero no 
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Figura 6.11. Promedio de respuestas recordadas y correctamente identificadas con el 
estímulo y la lista en el paradigma 4-B, A-C, La puntuación máxima posible en cada 
caso es de ocho (tomada de Barnes y Underwood, 19591. 


B, estaba pareada con A,).? Además, aunque este paradigma producía el acostum- 
brado gran decremento de recuendo para A-B, el olvido no era mucho mayor que el 
producido por un paradigma 4-B, C-D. Por éstas y otras razones, Postman y 
Stark sugirieron que la interferencia retroactiva no era causada por un desapren- 
dizaje de asociación de estímulo específico, sino que se debía fundamentalmente a 
una supresión del conjunto completo de respuestas de la primera lista, una supre- 
sión que se desarrolla durante el aprendizaje de la segunda lista y persiste por un 
tiempo hasta una prueba de retención posterior para A-B. Según esta hipótesis, el 
aprendizaje interpolado C-D provocaría la supresión del conjunto de respuesta B 
(como lo hace la interpolación A-C), y por ello estos reactivos no son asequibles co- 
mo respuestas en la prueba de recuerdo de A-B. Pero si las respuestas B se hi- 
cieran asequibles como en la prueba de reconocimiento de par, entonces la persona 
mostraría que no había desaprendido la asociación 4-B. 

A raíz del reto de Postman y Stark no tardó en aparecer evidencia para el des- 
aprendizaje de estímulo específico. Un raudal de experimentos informaron muy 


VEl reconocimiento de par muestra /K fuerte en el paradigma A-B, A-C si la respuesta de interfe- 
rencia € se incluye entre las tentaciones distractoras en la prueba de opción múltiple para A-B (R. €. 
Anderson y Watts, 1971). Sin embargo, esta ER podría explicarse por la competencia de respuesta y la 
pérdida de diferenciación de lista en lugar de deberse al desaprendizaje especifico de A-B. Á pesar de 
todo, al parecer la ejecución de reconocimiento en el experimento de Postman y Stark era demasiado 
elevada en todas las condiciones para revelar algún efecto debido al desaprendizaje asnciativo. 
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pronto de demostraciones de este efecto (Bimbaum, 1972; Delprato, 1972, Wea- 
ver et al., 1972). Un experimento típico fue el que realizó Delprato (1972). Este 
investigador empleó un diseño “intra lista”” en el cual, a través de dos listas, los 
diferentes reactivos dentro de la lista aprendida por un sujeto ejemplificaban una 
relación A-B, C-D, y otros reactivos representaban una relación A-B, A-C. El 
punto importante en tal diseño es que un factor como “*supresión de las respues- 
tas de la primera lista'* debería operar igualmente en todos los parés de la primera 
lista, independientemente de que el reactivo correspondiente de la segunda lista 
sea C-D o A-C. Por lo tanto, cualquier diferencia entre los reactivos en el recuer- 
do de A-B acaso podría atribuirse al aprendizaje de estímulo específico (es decir, 
el aprendizaje de 4-C específicamente debilita a 4-B en algún sentido absoluto). 
El experimento de Delprato demostró exactamente este resultado, con mayor 
olvido en aquellos pares específicos seguidos de A-C, que en los seguidos de C-D. 

Además, era posible probar el desaprendizaje de estímulo específico incluso con 
la comprobación de reconocimiento de par (Merryman, 1971), En apariencia, la 
ejecución de reconocimiento en todas las condiciones del experimento de Postman 
y Stark era demasiado alta para proporcionar una prueba sensible del desaprendi- 
zaje específico. Por lo tanto, todavía podemos retener la idea del desaprendizaje 
de estímulo específico. Sin embargo, parece haber algo en la noción de una pérdi- 
da general de disponibilidad de las respuestas de la primera lista, debida al apren- 
dizaje de la segunda. Cabría pensar en esta pérdida como el desaprendizaje de 
asociaciones entre los estímulos contextuales generales y tales respuestas 
(McGovern, 1964; Keppel, 1968). Se ha propuesto que esta pérdida de disponi- 
bilidad para los indicios contextuales puede estudiarse en la situación multilista de 
recuerdo libre, donde no hay indicios explícitos para el recuerdo de cada reactivo 
enla lista. 


Interferencia proactiva y recuperación espontánea 


La interferencia proactiva es el decremento en el recuerdo de la segunda lista 
(4-C), causado por el aprendizaje previo del material de la primera (4-B o D-B). 
Los efectos proactivos son mínimos inmediatamente después del aprendizaje A- 
C, pero se incrementan durante un intervalo de retención. Es como si la persona 
se confundiera en la prueba de retención con las dos listas que ya ha estudiado, de 
modo que una probable explicación de la interferencia proactiva es que ésta impli- 
ca progresivamente más confusión entre las dos listas aprendidas con anterio- 
ridad; llamemos a esto “idea de diferenciación de lista'”. Es razonable que la habi- 
lidad de discriminar entre los reactivos de la segunda lista que aparecieron t horas 
antes, y los reactivos de la primera lista que ocurrieron (t + 4) horas antes, dis- 
minuya a medida que t se hace más grande, lo que constituye una especie de ley 
de Weber-Fechner para la discriminación del tiempo. 

Pero se ha ofrecido una segunda explicación de este incremento en la interfe- 
rencia proactiva con un aumento en el intervalo de retención a continuación del 
aprendizaje de A-C. Esta hipótesis presupone que las asociaciones originales A-B 
se extinguen, desaprenden o inhiben durante el aprendizaje de A-C y, que tales 
asociaciones recuperan espontáneamente parte de su fuerza anterior durante 
el intervalo de retención. Existe una analogía con la observación de Pavlov (véase el 
capítulo 3) de que las respuestas condicionadas se recuperan durante un periodo 
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de descanso, después de una serie de ensayos de extinción. Claramente, si las 
asociaciones A-B se recobran de modo espontáneo, competirán con el recuerdo 
A-C y proparcionarán una interferencia proactiva creciente a medida que la recu- 
peración se incrementa con el paso del tiempo. 

Diversas líneas de evidencia apoyan esta idea de la recuperación A-B después 
del aprendizaje A-C. Una de ellas es un experimento previo de Briggs (1954), que 
estudió el predominio relativo de los hábitos A-B y A-C durante varios intervalos 
de retención usando la prueba modificada de recuerdo libre (PMRL). En este ex- 
perimento los sujetos aprendían una primera lista de 12 pares de adjetivos (4-B) 
con el criterio de una recitación perfecta, descansaban 24 horas, y aprendían en- 
tonces una segunda lista (4-C) con el mismo criterio, después recibían una PMRL 
final, transcurridos 4 minutos o 6, 24, 48 o 72 horas. En varias etapas durante el 
curso del aprendizaje original y del interpolado los sujetos se sometían a una 
PMRKL, en la cual se les pedía que proporcionaran cualquier respuesta que les 
viniera a la mente conforme se les mostraba cada término de estímulo. Los resulta- 
dos aparecen en la figura 6.12. En el panel de la izquierda de muestra la frecuencia 
relativa de las respuestas de la primera lista (A-B), en contraste con las asocia- 
das preexperimentales (4-E) de fuera de la lista, cuando se daban pruebas des- 
pués de varios niveles de ejecución de la primera lista. Los criterios se especiócan 
en términos del porcentaje de pares correctos en el ensayo de entrenamiento jus- 
to antes de la PMRL (0, 1/4, 2/4, 3/4, 4/4 de la lista). Cormno era de esperar, los aso- 
ciados extralista declinan, mientras que las respuestas de la lista 1 se incremen- 
tan. Tras un intervalo de descanso de 24 horas, la PMR£ revela cierta elevación 
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Figura 6.12. Los conjuntos de curvas de la izquierda y del centro son las iunciones de 
adquisición y de extinción cuando las listas 1 y 2 5e aprenden sucesivamente en un 
paradigma retroactivo-interterencia. £l recuerdo como una función del tiempo desde 
el final del aprendizaje de la lista 2 se muestra en el conjunto de curvas de la derecha 
(adaptada de Briggs, 1954). 
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en los asociados extralista y una pérdida de los asociados de la primera lista (ob- 
sérvese el punto ( en la lista 2, panel medio). Entonces, durante el aprendizaje de 
la lista 2 con vatios criterios, las respuestas de la lista 1 y los asociados extralista 
declinan, mientras que las respuestas de la lista 2 se incrementan. 

Los datos de interés para la hipótesis de la recuperación espontánea se encuen- 
tran en el tercer panel (de grupos de sujetos separados), que presenta los porcen- 
tajes relativos de las respuestas B, C o E en diferentes intervalos de retención, 
Esta gráfica muestra con claridad una gradual recuperación en el transcurso del 
tiempo de los asociados A-B y A-E, con la correspondiente pérdida de las asocia- 
ciones A-C aprendidas más recientemente. Estas curvas son exactamente lo que 
cabría esperar silos asociados A-B y A-É se recuperaran en fuerza después de su 
desaprendizaje durante el entrenamiento A-C. 

Desde luego, el problema con esta interpretación es que la PMRL constituye 
una medición de las fuerzas relativas de respuesta de B, C y E. Los resultados de 
Briggs pudieron producirse sólo por una mayor pérdida absoluta en A-C en vez de 
una recuperación absoluta en 4-B, a A-E. La manera obvia de proceder es inten- 
tar demostrar la recuperación absoluta de A-B en una situación de recuerdo no 
competitiva, específicamente en las pruebas de **modificación modificada de re- 
cuerdo libre”? (PMMRL) del tipo que usaron Barnes y Underwood. Es decir, el 
sujeto ha de intentar recordar tanto la respuesta B como la C cuando tienen como 
indicio al estimulo A. 

Pero la evidencia de la recuperación espontánea en los estudios de cambios 
temporales que usan PMMAL es equívoca, en particular para los intervalos de re- 
tención más largos, que se extienden desde varias horas hasta varios días. Sin em- 
bargo, subsiste la posibilidad de que una pequeña recuperación absoluta de 4-B 
quede enmascarade por la recuperación progresivamente mayor de los asociados 
preexperimentales (4-E), que el sujeto suprime en la prueba típica PMMRL. De 
ser así, la recuperación de A-B debería producirse con mayor probabilidad en las 
PMMRL aplicadas a intervalos razonablemente cortos después del aprendizaje de 
A-C. En estas condiciones, se ha logrado obtener la evidencia positiva para la re- 
cuperación absoluta de A-B (Postman et a!., 1968; Postman et a!., 1969). 

En la figura 6.13 se muestran algunos datos de recuperación de un experimento 
de Postman, Stark y Henschel (1969, experimento JID. Los sujetos aprendieron 
tres listas sucesivas, que tenían una relación A-B, A-C, A-D, o una relación 4-B, 
C-D, E-F para diferentes sujetos, y entonces recibían una PMMRL 2 o 18 minu- 
tos después del ensayo de aprendizaje final. Dos grupos control aprendían la lista 
A-B, y luego se les sometía a prueba en su recuerdo después de un intervalo tem- 
poral igual a aquel ocupado por el aprendizaje interpolado, más 2 o 18 minutos. En 
la figura 6.13 se muestra una recuperación absoluta significativa durante el intervalo 
de retención para las respuestas de la primera y de la segunda listas; la respuesta 
de la tercera lista no se desaprendía y mostraba un nivel elevado de recuerdo en 
ambos intervalos de retención. Significativamente, las cantidades de recuperación 
son comparables para el grupo A-B, A-C y el grupo A-B, C-D. Este hecho sugie- 
re que tal recuperación de las respuestas de la lista inicial puede deberse a la disi- 
pación en el transcurso del tiempo de la “supresión del conjunto de respuesta”, 
en logar de la recuperación espontánea del desaprendizaje asociativo de estímulo 
específico. Es decir, durante el aprendizaje interpolado la persona puede hacer 
disponibles las respuestas que se usan en esa lista, mientras suprime selectiva- 
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Figura 6.13. Promedio de pares asociados recordados de las listas primera, segunda y 
tercera después de 2 o 18 minutos de demora, para los sujetos que recibían el para- 
digma 4-8, A-C, A-D (cuadro izquierdo), o el paradigma A-B. C-D, F-F (cuadro dere- 
cho) También se muestran los recuerdos de los grupos de control que volvieron a so- 
meterse á prueba durante un tiempo equivalente a continuación del aprendizaje 
de Ja lista 1 (tomada de Postman, Stark y Henschel, 1969) 


mente el conjunto de respuestas utilizadas en listas anteriores. Pero esta supre- 
sión se disipa con el tiempo, y permite que las respuestas antiguas se vuelvan cada 
vez más disponibles para su recuerdo en las PMMRL. Este tema de la fuente 
de recuperación, ya sea de la disponibilidad de la respuesta o de las asociaciones de 
estímulo y respuesta, es en la actualidad objeto de investigación. 


La magnitud de los efectos de la interferencia proactiva 


Un cambio importante que ha tenido lugar en la teoría de la interferencia consis- 
te en el poderoso papel asignado a las fuentes proactivas de interferencia en el ol- 
vido. En un artículo central, Underwond (1957) empleó la noción proactiva para 
aclarar lo que había sido una fuente primordial de problemas en la teoría de la in- 
terferencia, La mayor parte de los estudios iniciales acerca de la retención han de- 
mostrado un olvido hastante masivo (alrededor del 30 al 90%) en intervalos de 24 
horas. Se afirmaba que obedecía a la interferencia del aprendizaje casual interpo- 
lado, pero la explicación parecía poco convincente puesto que era difícil i imaginar 
un considerable aprendizaje cotidiano que interfiriese con los materiales sin sen- 
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tido aprendidos en el laboratorio. Al comparar varios informes, Underwood deter- 
minó que aquellos estudios que informaban de olvido masivo habían utilizado a los 
mismos sujetos en diversas condiciones de aprendizaje de lista. Cuanto más listas 
hubiera aprendido un sujeto, mostraba mayor tendencia a olvidar la última si el re- 
cuerdo se medía al día siguiente. Así, los efectos proactivos supuestamente se 
acumulaban sobre las listas aprendidas con anterioridad, Si un sujeto aprendía sólo 
una lista de material verbal, entonces su recuerdo era muy alto, entre 75 y 80% 
después de 24 horas, 

Un experimento de Keppel, Postman y Zavortink (1958) proporciona una ilustración 
muy apropiada de los efectos proactivos masivos. Los investigadores hicieron que 
cinco estudiantes universitarios aprendieran y recordaran 36 listas sucesivas 
(relaciones A-B, C-D) de diez pares asociados en intervalos de 48 horas. Cada se- 
sión comenzaba con una prueba de recuerdo de la lista anterior aprendida, seguida 
por el aprendizaje de una nueva lista con el criterio de una recitación perfecta. Los 
porcentajes de recuerdo se muestran en la figura 6.14, trazados en bloques suce- 
sivos de tres listas, la que comprueba un acentuado decremento en el recuerdo 
desde alrededor del 70% en la primera lista hasta aproximadamente el 5% en las 
dos últimas. Estas proporciones ponen de manifiesto los poderosos efectos que la 
la interferencia proactiva puede producir, No ilumina, por supuesto, al mecanismo 
gue sustenta a la interferencia proactiva en el diseño A-B, C-D, E-F. Presumi- 
blemente es la pérdida de disponibilidad de las respuestas de la lista final; de ser 
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Figura 6,14, Porcentaje promedio de recuerdo de la lista inmediatamente previa a un 
intervalo de 48 horas como una función del número de listas previas, en bloques de 
tres listas. Las lineas oscuras gruesas promedian bloques más grandes de nueve listas 
ltomada de Keppel), Postman y Zavortink, 1968) 
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así, no deberían existir efectos proactivos acumulativos demostrables en las prue- 
bas de reconocimiento de par, o si las palabras de respuestas de listas sucesivas 
provienen de categorías distintivamente diferentes y semánticas (aunque recor- 
dables). 

Como hemos dicho, después de 24 horas el recuerdo de una lista bien aprendida 
es de alrededor del 75%, cuando no se han aprendido listas de interferencia. 
Underwood y Postiman (1960) trataron de explicar el 25% restante del olvido ob- 
servado al recurrir a fuentes de interferencia extraexperimentales. Señalaron que 
en el aprendizaje de asociaciones verbales arbitrarias o material sin sentido en el 
laboratorio, es probable que el sujeto tenga que desaprender los hábitos verbales 
previos que comparte con otros miembros de su comunidad lingúística, Estos há- 
bitos verbales anteriores pueden ser de dos tipos: asociaciones de secuencias de 
letras o asociaciones de secuencias de unidad (palabra). Para dar un ejemplo claro, 
es seguro que un sujeto entra en la situación experimental con asociaciones pre- 
vias de palabras como mesa-silla y luz-oscunidad. Supóngase que la tarea de 
aprendizaje requiere que el sujeto forme las nuevas asociaciunes mesa-oscurndad y 
hez-silla. Durante un intervalo de descanso, la recuperación espontánea de los 
asociados anteriores desaprendidos produce un decremento en la probabilidad de 
que el sujeto recuerde las asociaciones aprendidas en el laboratorio, Los expe- 
rimentos de Underwod y Postman, así como algunos otros estudios de seguimien- 
to relacionados, muestran algunos méritos de este anábsis. Los nuevos materiales 
que chocan con los hábitos verbales previos se olvidan con más facilidad, y por lo 
común se distorsionan para concordar con los hábitos previos. Sin embargo, la 
evidencia de esta hipótesis es un tanto conflictiva, y al parecer existe una variedad 
de factores que complican y oscurecen la relación que se ha conjeturado. 

Una contundente demostración de la interferencia proactiva debida a los hábitos 
Iingúísticos previos se encuentra en un estudio de Coleman (1962), quien tomó de 
un libro un párrafo en prosa de 24 palabras y las mezcló al azar, Al sujeto se le pro- 
porcionaba este orden aleatorio para que lo estudiara brevemente, e intentara enton- 
ces reconstruir rigurosamente el orden serial de las palabras que había estudiado. 
Este orden reconstruido se le presentaba a un segundo sujeto para que lo estu- 
diara y recordara, y con su nuevo orden reconstruido se le daba entoxices a un ter- 
cer sujeto, y así sucesivamente. El pasaje se filtraba en sucesión a través de 16 
sujetos. Á medida que pasaba de un sujeto a otro, su recuerdo (arden recanstrul- 
do) se distorsionaba más y más en relación con el original y en dirección de oracio- 
nes razonables. Uno de los párrafos originales de Coleman y la reconstrucción de- 
cimosexta del mismo aparecen en el cuadro 6.2. La cantidad de cambios es sor- 
prendente, especialmente si se considera que cada suieto intentaba reproducir al 
pie de la letra el orden exacto de palabras que había estudiado, El cambio ilustra 
vívidamente el poderoso efecto de los hábitos verbales previos en la distorsión del 
recuerdo de las asociaciones conflictivas, 


Interferencia con el texto significativo 


Los estudios de laboratorio acerca de la interferencia que hemos examinado em- 
plean materiales “sin significado”, ya sean sílabas sin sentido o palabras esco- 
gidas al azar y carentes de relación. Sin embargo, algunas investigaciones recien- 
tes proporcionan evidencia de que existen procesos similares de interferencia que 
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CUADRO 6.2. Cambios en el recuerdo de un párrafo a medida que pasa por una 
cadena de aprendices (tomada de Coleman, 1962). 


Parrafo original estudiado por el “por era bien parecido modo y tratarlas 
primer sujeto: hacta que de un él las tranquilo joven 
simpático maneras un las locas 
muchachas a volverse de ...”* 
Reproducción del decimosexto sujeto “era un joven simpático tranquilo de 
en la cadena: maneras bien parecido y un modo de 
E tratarlas que hacía a las muchachas que 
se volvieran locas por él...” 


operan en el aprendizaje y en el olvido de textos significativos, tanto al nivel de 
oraciones aisladas como al de conjuntos interrelacionados (párrafos de textos). 
Aunque unos cuantos experimentos no analíticos iniciales plantearon ciertas dudas 
acerca de los procesos de interferencia, algunas demostraciones positivas recien- 
tes muestran una interferencia retroactiva o facilitación retroactiva que dependen, 
de manera ngurosa, del arreglo exacto de los materiales y de la medición de re- 
tención utilizada para evaluar las pérdidas (T, R. Anderson y Bower, 1973; R. C. 
Anderson y Myrow, 1971; R, €, Anderson y Carter, 1972; Crouse, 1971; Myrow 
y Anderson, 1972). 

Podemos ilustrar los temas con el recuerdo de oraciones declarativas activas 
simples de la forma sujeto-verbo-objeto (por ejemplo, '“El mecánico reparó el re- 
frigerador'”). Esta proposición puede considerarse en una de dos formas: la ora- 
ción establece en la memona una cadena serial de asociaciones entre las palabras 
sucesivas, o instaura conexiones funcionales clasificadas entre los grupos de con- 
ceptos semánticos que estas palabras específicas excitan, Diversas consideracio- 
nes sugieren que la segunda opción es más correcta y fructífera. Ahora podemos 
tratar los conceptos semánticos que corresponden al sujeto, al verbo transitivo y 
al objeto (lamémoslos S, V, O) como si fueran términos en una tarea de aprendi- 
zaje de asociación ““triple””, a excepción de que hay una enorme cantidad de restric- 
ciones sintácticas y de selección semántica que impiden ciertas combinaciones de 
palabras (por ejemplo, *“Noche el irrumpe corriendo la”? literalmente no tiene sen- 
tido). 

El tratar a Jos conceptos como términos de una tríada asociativa, nos lleva a es- 
perar interferencia en este nivel, si un concepto dado co-acurre con diferentes 
conceptos en nuevas predicaciones. Así, a continuación del aprendizaje de S,-V,O,, 
la interpolación de S,-V20, o de S-V,O, conducirá a una pérdida asociativa entre S; 
y V,O,, cuando el entrelazamiento se efectúa en cualquier dirección. Esta pérdida 
se evalúa en relación onn una interpolación de control simbolizada como S,-V,0.. 
En un experimento dirigido por G. H. Bower (1978) se demostró una clara trans- 
ferencia negativa y una interferencia retroactiva en los sujetos que aprendían ora- 
ciones interpoladas que guardaban una relación A-D, C-D a A-Br con las oraciones 
originales aprendidas (veáse la tabla 6.1. para las condiciones de transferencia), 
Los resultados estaban ordenados exactamente como lo predecían los resultados 
de transferencia de pares asociados. 

Además, la interferencia evidentemente se produce a nivel del aprendizaje con- 
ceptual, lo que se demuestra al usar paráfrasis sinónimas, por ejemplo, de la cons- 
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trucción verbal 140,. Supóngase que S,-Y,0, es la oración “El alguacil levantó al 
adormilado paciente””; si dejamos que P(V,O,) designe la paráfrasis sinónima del 
enunciado, entonces una oración Sa-P(V,O,) podría ser: *““La enfermera despertó 
a la persona enferma que dormía”. Se ha descubierto que la interpolación de tales 
construcciones parafraseadas produce casi tanta interferencia retroactiva como el 
uso del 1,0, al pie de la letra, pareado con un nuevo sujeto-sustantivo, S, (R.C. 
Anderson y Carter, 1972). Aparentemente, el indicio V,O, hace contacto con una 
huella similar en la memoria de la forma en que lo hace su paráfrasis P(V,O,), y el 
5, asociado con P(V,O,) compite con el recuerdo del $, asociado antes con el mis- 
mo predicado mediante el uso de las palabras V,0,. 

Por supuesto, este efecto de paráfrasis podría utilizarse ventajosamente si se 
desea facilitar las asociaciones conceptuales (significado). Así, un experimento de 
dos listas en el cual 5,-V,0, en la lísta 1 va seguido de S,-P(Y,0,), en la lista 2 dará 
lugar a un recuerdo acrecentado sustancial correcto (significado) del indicio S, 
de la lista 1, pero probablemente con alguna pérdida en el recuerdo exacto de 
V,0,. Por la misma razón, una oración parafraseada P(S)-P(4,0) (por ejemplo, 
**El policía despertó a la persona enferma que dormía'*) se aprende con rapidez 
mediante una alta transferencia positiva a continuación del aprendizaje S,-V,0,. Es 
importante mantener la claridad acerca de esta distinción entre el recuerdo al pie 
de la letra y el sustancial, ya que es posible facilitar asociaciones entre los concep- 
tos generales, al mismo tiempo que uno interfiere con el recuerdo al pie de la letra. 

Un ejemplo particularmente notable de la separación de estos dos niveles se en- 
cuentra en un experimento de S. A. Bobrow (1970), quien demostrá que si los 
sustantivos sujeto u objeto de una oración se repitieran como un par en la segunda 
oración, la asociación entre ellos podría o no acrecentarse dependiendo de si 
los significados de los sustantivos se mantienen en ambos contextos. Por ejemplo, los 
sujetos aprenden a asociar partes de sustantivos como lanzador y mermelada, y lo ha- 
cen usando oraciones vinculadoras como mediadores. Supóngase que una oración en 
la sta de estudio inicial fuera: “El levzador de leche se salpicó de mernielada dulce”. 
Una oración en la segunda lista que preservara un similar significado conceptual para 
los sustantivos, sería: ““El lanzadorde limonada estaba pegajoso con mermelada de 
frambuesa'”, mientras una que altera por completo el significado conceptual podría 
ser: ''El lanzador de beisbol quedó atrapado en un embotellamiento de tráfico”. 
La prueba de retención, que se suministra al final de la segunda lista de estudio, 
implica la presentación del sustantivo-sujeto (/anzado?) para recordar el sustantivo- 
objeto (mermelada). Como sugiere nuestra intuición, la asociación entre sujeto y ob- 
jeto se incrementa de forma considerable mediante la interpolación de una pre- 
dicación idéntica o conceptualmente similar. Pero cuando los significados de las 
palabras se cambian no se produce un aprendizaje acumulativo: la ejecución es se- 
mejante a la que habría ocurrido si el par tanzador-mermelada se hubiese presen- 
tado sólo una vez. 

Aunque nuestros ejemplos son aplicables al recuerdo de oraciones individuales y 
aisladas, también se han demostrado efectos de interferencia para párrafos, cuen- 
tos, “pasajes de textos científicos'”, y fragmentos similares. En tales experi- 
mentos, debemos atender cuidadosamente a los asertos atómicos que relacionan 
conceptos en el texto inicial, y a la manera en que las predicaciones específicas 
acerca de estos conceptos se alteran en el aprendizaje interpolado. Por ejemplo, 
Crouse (1971) y G. H. Bower (1974) han empleado breves biografías de personas 
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imaginarias como pasajes experimentales. Éstas comprenden en esencia una lista 
de hechos en la vida de esa persona. Un pasaje interpolado que produce poca in- 
terferencia con la biografía puede referirse, por ejemplo, a una exposición de arte, 
mientras que un fragmento que crea una interferencia máxima es una segunda bio- 
grafía que cambia sistemáticamente algunos de los hechos que aparecen en la pri- 
mera (como nombres, fechas, lugares, actividades, etc.). Bower descubrió que 
Jos sucesos específicos que permanecen igual en ambas biografías se facilitan en el 
recuerdo de la primera, mientras que aquellos que se varían (por ejemplo, la ocu- 
pación de) padre) se olvidan, aun cuando el sujeto sea propenso a recordar men- 
cionando algún detalle relacionado con el tipo general de los hechos. Es decir, el 
syeto podría recordar algo acerca de la ocupación del padre, pero se equivocaría 
en los aspectos especificos. Esto sugiere, como hemos dicho, que mediante la in- 
terpolación apropiada podemos facilitar de modo selectivo el recuerdo de la “ma- 
croestructura”” conceptual de un pasaje, mientras al mismo tiempo intetfiere con 
la memoria de la “microestructura”” específica del material. Otro experimento 
realizado por Thorndyke y Mayes-Roth (1979) muestra con suna claridad estos 
dos efectos: el aprendizaje de la macroestructura junto a la interferencia con los 
microdetalles del pasaje. 


COMENTARIOS FINALES 


Esta breve exposición acerca de la teoría de la interferencia basta para indicar 
sus características esenciales. Los principales cambios que ha sufrido pueden re- 
sumirse en la aceptación de las nociones del desaprendizaje y de la supresión del 
conjunto de respuesta, un nuevo énfasis en la interferencia proactiva, y la identi- 
ficación de una potente fuente de efectos proactivos en aquellos hábitos 
lingúísticos previos que entran en conflicto con las asociaciones verbales tempo- 
rales establecidas en un experimento de laboratorio. La investigación se diri- 
ge cada vez niás a la comprensión de ld interferencia y del olvido de oraciones 
significativas y conjuntos más amplios de textos. También se han producido mo- 
dificaciones en las técnicas experimentales utilizadas. Por ejemplo, el procedi 
miento modificado de recuerdo de Barnes y Underwood que ya mencionamos se 
usa mucho en la actualidad debido a le información adicional que brinda acerca de lo 
que la persona recuerda, El reconocimiento de par se utiliza para evaluar el apren- 
dizaje asociativo, mientras que el recuerdo kbre se concibe a menudo como un ín- 
dice de la pura '*disponibilidad de respuesta”. Éste es un campo activa de inves- 
tigación y ninguna reseña puede hacerle justicia a la extensión de variables que se 
han estudiado en relación con ei olvido. Para exposiciones más completas, véanse 
McGeoch e Irion (1952), J, F. Hall (1971), Postman (1971) y Spear (1978). 

Los actuales estudios acerca del aprendizaje y el olvido humanos continúa en 
una fase sumamente analítica y ponen el acento en el análisis cada vez más rmi- 
nucioso de los detalles. Como sucede en otras especialidades durante las fases 
analíticas, se ha hecho a un lado la síntesis de los conocimientos dentro de una 
concepción más amplia de Jos fenómenos. Como resultado, las posibles aplica- 
ciones de nuestros conocimientos científicos la resolución de problemas prácticos 
sólo se han explorado superficialmente y de una manera vacilante. Para mencionar sólo 
un gran problema aplicado: los educadores o quienes se dedican a la capacita- 
ción de personal sin duda desean conocer la mejor forma de enseñar un tema a 
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sus estudiantes y que éstos lo retengan durante largo tiempo. El trabajo de labora- 
torio relativo a la retención con las condiciones en las cuales se imparte el entre- 
namiento tiene una evidente trascendencia, pero muchas veces está tan alejado 
del tipo de tarea, el fondo y otras variables que integran a la situación aplicada, que 
se requiere de alguna ingeniosa extrapolación antes de que los principios puedan 
aplicarse. Los escritos de Gagné (1970) y Staats (1968), así como las compilacio- 
nes de articulos editados por Hilgard (1964a) y por DeCeccu (1967) constituyen 
algunos de los intentos de extrapolación más razonables. El área de la psicología 
de la instrucción trata de mejorar las prácticas de enseñanza en las escuelas con la 
ayuda de los principios del aprendizaje, el análisis de tarea y el entrenamiento de 
habilidades. 


Características de la tradición del aprendizaje verbal 


Una vez revisadas las investigaciones acerca de temas selectos en la tradición 
del aprendizaje verbal, ¿qué podemos concluir en torno de las características y las 
actitudes orientadoras en el área? 

Primero, la tradición funcionalista estaba comprometida con un ambientalismo 
firme, y suponía que las diferencias individuales surgieron en gran parte de las di- 
vergencias en las habilidades y hábitos adquiridos. Tenían una fuerte creencia en 
la causación histórica de la conducta actual de manera que la causa de las respues- 
tas actuales de la persona han de buscarse en su entrenamiento pasado y en la for- 
ma en que éste se transfiere a la situación presente. 

Segundo, la “'mente”” se considera como un nombre colectivo que abarca un 
conjunto de disposiciones para comportarse de formas peculiares en circunstancias 
particulares. El describir la mente de una persona como brillante o tonta, retentiva 
u olvidadiza, rápida o lenta, no significa referirse a alguna entidad interna que hace 
que los individuos actúen de cierta manera; más bien consiste en aludir a sus capa- 
cidades y tendencias para actuar así en la generalidad de los casos. Esta posición 
es prácticamente la misma que caracteriza a la del programa conductista. 

Tercero, el teórico del aprendizaje verbal prefiere conceptos científicos que son 
mensurables intersubjetivamente. Así, el “"carácter significativo”? de una palabra 
se identifica con el número promedio de asociados que recuerda en treinta segun- 
dos, aunque esto pasa por alto la definiciones tradicionales del significado en tér- 
minos de referencia, uso o propiedades definitorias. Los teóricos del aprendizaje 
verba) tienen un prejuicio contra los constructos mentalistas como las imágenes y 
el pensamiento no verbal. Hasta donde es posible, presuponen que los eventos 
perceptuales se categonzan, codifican y almacenan de acuerdo con las denomi- 
naciones verbales provocadas por ellos, También se oponen a los constructos va- 
Bos y heurísticos como organización, estructura, discernimiento y propiedades 
gestaltistas de los conjuntos de estímulo. Cuando es factible. traducen lo minu- 
cioso y lo místico en una terminología más simple de repertorios de hábitos o pa- 
trones de estímulo. Se cree que las discontinuidades en el aprendizaje ocultan las 
continuidades subyacentes en la adquisición del hábito. 

Cuarto, como hemos señalado, la tradición del aprendizaje verbal ha estado 
comprometida de una manera firme y total con el asociacionismo, en un romance 
prolongado en su madurez con la teoría del £-R de Hull, que luego abandonó en 
detalle mas no en espíritu. Los teóricos del aprendizaje verbal intentaron explicar 
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prácticamente todos los fenómenos descubiertos en el laboratorio en términos de 
sistemas asociativos particulares establecidos entre los estímulos y las respues- 
tas, y la operación de reglas simples de recuperación, como la similitud de indicio y 
la competencia de la respuesta. Los principios generales del asociacionismo se cri- 
ticaron en el capítulo 1 y serán retomados en el capítulo 13. 

Quinto, la tradición del aprendizaje verbal ha sido fomentada por un pequeño 
grupo de psicólogos, sus discípulos y los estudiantes de sus discípulos, Los prime- 
ros funcionalistas de relieve (después de Ebbinghaus) fueron Carr, Dewey y 
Woodworth; éstos incidieron sobre el pensamiento de McGeoch y a Irion, los cua- 
les a su vez influyeron a Nelton, Bilodeau, Underwood, Cofer, Osguod y Post- 
man, que a su vez dejaron su impronta en los lineamientos de Keppel, Schulz, 
Spear y Martin, entre otros. El fervor con que se iniciaron investigaciones sobre 
temas particulares ha pasado de una generación a la siguiente, y muchos discípulos 
de estos cientificos han seguido brillantes trayectorias por derecho propio. La de- 
dicación y la energía de este grupo de investigadores les ha hecho merecedores de 
la gratitud de innumerables colegas. 


Modificaciones en el asociacionismo 


Es justo destacar que en manos de Jos modernos teóricos del aprendizaje verbal 
el asociacionismo es diferente del que sustenta la antigua corriente británica, aun- 
que haya evolucionado de esa tradición filosófica como fespuesta a las críticas y a 
los resultados empíricos. En el capítulo 1, bajo el rubro de racionalismo se citaron 
varias objeclones, de manera que aquí revisaremos algunas de ellas. En primer fu- 
gar, que la teoría asociacionista clásica se explayaba muy poco en lo que toca a la 
organización perceptual de los elementos sensoriales, ahora es evidente que la or- 
ganización y la '“pertenencia'” del material sensorial afecta considerable mente a lo 
que el sujeto aprende. Así, cuando se le instruye para que escuche una secuencia 
de pares de palabras , A-B, C-D, E-F, el sujeto segmenta la corriente en pares, y 
un elemento se asocia con el otro de su par, pero de ninguna manera con los que 
corresponden a pares precedentes o siguientes, a pesar de su contigiiidad tempo- 
ral objetiva, Los asociacionistas modernos aceptan tales resultados, pero además 
intentan demostrar que la segmentación o la operación misma de agrupamiento se 
considera teóricamente como una estrategia de atención o una respuesta aprendi- 
ble de nivel superior, que mostrará transferencia negativa, y así sucesivamente. 

Un segundo punto en contra del asociacionismo clásico es que no reconocía los 
numerosos fipos distintos de asociaciones que codifican diferentes tipos de rela- 
ciones entre dos ideas. El denominar a Jas asociaciones de acuerdo con su tipo 
permitiría búsquedas eficientes, con dirección y relación a la memoria, y haría po- 
sible la recuperación directa de respuestas para preguntas como ésta: “¿Qué con- 
cepto tiene una relación RR con el concepto X?”' (por ejemplo, “¿Cuál es la 
categoría supraordinada para canario?””). La recuperación de respuestas para ta- 
les preguntas en ocasiones es tan rápida que resulta difícil creer que los individuos 
examinen de algún modo largas listas de asociaciones en la memoria para tratar de 
encontrar un elemento en una lista de nombres supraordinados, que también se 
encuentre en la lista de asociados para su concepto de canario, La recuperación 
directa, guiada por la relación, parece más consonante con la recuperación rápida. 
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En relación con lo anterior surge otra crítica contra el asociacionismo clásico, 
que sostiene que la teoría clásica no logra explicar adecuadamente por qué la aso- 
ciación recuperada depende tanto del contexto en el cual ocurre un estímulo. Así, 
una luz roja significa “*alto'* como señal de tráfico, pero significa **salir por aquí”” 
en tanto señal de salida en caso de incendio, Este problema puede tratarse al pre- 
suponer que los indicios de recuperación siempre actúan dentro de un patrón 
complejo, que diferentes metas o ambientes conducen a distintos componentes de 
estímulo en la memoria de corto plazo (meta A o B o ...), y que un estímulo 
naaa (X) excita diversas asociaciones en el patrón A + X que en el patrón 
B+X. 

Otro punto no previsto en el asociacionismo clásico es que muchas de las aso- 
ciaciones observadas (como RML-SOL) de hecho no son directas sino mediadas a 
través de una cadena de asociaciones más elementales. Así, la contigitiidad tempo- 
ral de RML y SOL en la experiencia del aprendiz no da lugar a que establezca una 
asociación independiente; antes bien, inicia una búsqueda en la memoria de aso- 
ciaciones familiares que le resuelvan el problema planteado: unificar arbitra- 
riamente pares de unidades. Por supuesto, la noción de las cadenas de aso- 
ciaciones mediadoras cae dentro del espíritu del asociacionismo moderno. 

Un tercer problema con el asociacionismo clásico es que presupone que sólo 
las ideas simples entran en las asociaciones, y que éstas vinculan únicamente a las 
ideas simples, no a los bloques de ideas. Hull mantenía una restricción similar, según 
la cual en teoría sólo se permiten los vínculos *“horizontales'” (para una discusión 
acerca del tema, véase Wickelgren, 19795). Esta estructura asociativa y otras dos 
alternativas pueden observarse en la figura 6.15 para cuatro ideas interasociadas 
A, B, C, PD. El cuadro € muestra la hipótesis clásica, según la cual sólo se permi 
ten conexiones directas de elemento a elemento. (En este diagrama los vínculos 
deben interpretarse como asociaciones de dos direcciones.) El cuadro b muestra 
una estructura adquirida al crear un bloque abstracto o nodo grupal Y, con el cual 
cada uno de los elementos inferiores A, B, C, D, tiene vínculos de dos direc- 
ciones. Aquí, las ideas A, B, C, D no están relacionadas directamente, sino que se 
“comunican”” entre sí sólo a través del bloque nodal W. El nodo Wes abstracto en 
el sentido de que no representa nada a excepción de la co-ocurrencia de las cuatro 
ideas componentes como un patrón o grupo; dicho nodo también puede concebirse 
dentro de un sistema asociativo como una terminal interruptora para desviar la ex- 
citación que llega a W desde un indicio de recuperación, por ejemplo, el indicio A, 
a través de las diversas sendas hasta B, C, D, con lo cual activa esas ideas y las 
leva a la conciencia. Esta terminología deja ver que un sistema asociativo es bási- 
camente un conjunto de sendas de comunicación, y que los nodos se definen de 
acuerdo con cuáles sean los otros nodos (entradas) que los activan y los nodos (sa- 
lidas) a los que transmiten activación. 

Los experimentos de Roos y Bower (en prensa) y de Arnold (1976) apoyan las 
predicciones del modelo vertical del cuadro b más que el modelo horizontal del 
cuadro a, En el primer estudio, sujetos adultos estudiaron varios grupos de cuatro 
o cinco palabras ligeramente relacionadas, y luego se comprobaba su recuerdo de 
cada grupo al entrelazarlo con una o dos palabras. Las frecuencias de los diversos 
patrones de recuerdo al proporcionar uno y dos indicios se ajustaban cuantitativa- 
mente mucho mejor mediante el modelo vertical. Arnold (1976) llegó a una conclu- 
sión similar al examinar el recuerdo de uno y dos indicios en ternas de palabras es- 
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(b) 


Figura 6.15. [lustración de tres ti- 
pos de estructuras asociativas 
para interrelacionar cuatro reac- 
tivos o propiedades. designados 
como A, B, €, D. (a) Muestra sólo 
asociaciones horizontales. (b) 
Permite asociaciones verticales 
con el bloque nodal W. (c) Mues- 
tra asociaciones verticales que 
perfilan una jerarquía de dos gru- 
pos o bloques (Y, Zl que se agru- 
pan en el bloque de nivel supe- 
tel rior X. 


tudiadas, así como el reconocimiento de pares y ternas. La evidencia sugiere que 
el modelo vertical es preferible al horizontal. Anderson y Bower (1973), Estes 
(1972) y Wickelgren (1979), entre otros, también lo han recomendado. 

En el cuadro c de la figura 6.15 se advierte que los bloques nodales (Y, Z) se 
agrupan en un nodo de orden superior (4), lo cual le da a uno la capacidad de orga- 
nizar jerárquicamente los elementos básicos en grupos. Es evidente que necesita- 
mos una representación de conocimientos que permita cualquier segmentación y 
agrupamiento de elementos, y también una que nos permita representar el agru- 
pamiento recursivo, Esto se requiere, por ejemplo, si la teoría ha de representar 
l memoria de la persona para series de grupos de elementos. 

Tal representación se presupone en teorías como la de Lesgod y Bower (1970), 
la de Estes (1972), o en la explicación que Johnson proporciona (1970) de la me- 
moría para listas seriales de bloque. Anderson y Bower (1973) también utilizaron 
una jerarquía de unidades de ideas segmentadas para representar oraciones 
complejas en la memoria. Así, por ejemplo, en una oración declarativa simple, 
bh frase sustantiva (*“el viejo”) podría corresponder al nodo Y en la figura 6.5c, y la 
frase verbal (*“acariciaba al perro”') al nodo Z; entonces, el nodo X de nivel su- 
perior sería el código interno en la memoria que permite el acceso a la estructura 
conceptual establecida por el sujeto que escucha y comprende la declaración: “El 
viejo acariciaba al perro'*. Estos nodos de nivel superior como X, Y, Z pueden 
entrar por sí solos en otras asociaciones. Por ello la teoría asociativa ampliada pre- 
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vé el desarrollo de complejos conceptos arbitrarios codificados como configura- 
ciones asociativas de elementos, grupos de elementos, y grupos de grupos. Estos 
formalismos de sistema fundamentan gran parte de los desarrollos en las teorías 
nevasociativas del conocimiento, la utilización de conceptos y el aprendizaje posi- 
ciona) (Anderson y Bower, 1973; Kintsch, 1974; Norman y Rumelhart, 1975). 
Los desarrollos citados se examinarán en el capítulo 13. 


Críticas a la tradición del aprendizaje verbal 


Las críticas dirigidas a la tradición del aprendizaje verbal han señalado varios 
errores. Primero, emplean los conceptos asociacionistas del almacenamiento de la 
memoria para comprender sus resultados, pero generalmente no logra especificar 
al “monitor ejecutivo'* que utiliza esa base de memoria para responder preguntas 
o resolver problemas. Por ejemplo, los psicólogos del aprendizaje verbal han pro- 
puesto la idea de que los sujetos corrigen su recuerdo en un experimento de lista 
múltiple cuando tratan de recordar una lista específica; a medida que se recupera 
cada reactivo, se le verifica con la lista objetivo en cuestión y se le suprime si pro- 
viene de una equivocada. Pero en una teoría asociativa estricta, ¿qué es lo que eje- 
cuta esta función de corrección? ¿Cómo representamos el programa o la rutina 
que se ha instalado en la memoria de corto plazo para guiar esta estrategia de re- 
cuerdo de ''generar posibilidades y luego comprobar'”? ¿Cómo se adquieren estos 
programas? Normalmente, los psicólogos del aprendizaje verbal tradicional han 
pasado por alto tales interrogantes. Las teorías de simulación por computadora, 
como el modelo ACT de J. R. Anderson (1976), tratan explícitamente con estos 
procesos que usa la memoria asociativa. 

Otro reproche común es que los estudios dentro de la tradición del aprendizaje 
verbal no tienen mucho que decir acerca del aprendizaje del lenguaje. Pero el 
aprendizaje verbal, desarrollado durante la *era del condicionamiento'* de la 
psicología, siempre tuvo el propósito de estudiar el aprendizaje asociativo básico 
en arreglos simplificados, y nunca trató de llevar las tareas reales de la escuela di- 
rectamente al laboratorio. Muchas tareas escolares claramente poseen grandes 
componentes de aprendizaje por repetición mecánica, y a ellas al parecer son apli- 
cables los resultados de las analogías en el laboratorio, como cabría esperar (por 
ejemplo, la interferencia entre biografías similares). 

Una tercera objeción de los críticos es que la investigación del aprendizaje ver- 
bal es '*crasamente empírica”, que genera un sinnúmero de datos detallados sin 
revelar principios o teorías sólidas y generales. A esa crítica el estudioso del 
aprendizaje verbal respondería que la ciencia consiste ante todo en el análisis y la 
descripción de cualquier fenómeno y de sus innumerables facetas, y que las 
**grandes teorías'* son tan sólo **grandes ilusiones”, a no ser que previamente 
nos asegutemos una base empírica firme para la teorización. En este sentido, an- 
tes de adelantar conjeturas acerca de la teoria, deberíamos tratar de explicar la 
mayor parte de las variables que podrían influir, de alguna manera, sobre algún 
fenómeno experimental. 

Las científicos dedicados al aprendizaje verbal propusieron e investigaron un 
gran número de hipótesis teóricas, aunque éstas tienden a ser locales, ajustadas a 
un dominio restringido, y tienen condiciones fronterizas igualmente limitadas. Pe- 
ro en términos de hipótesis claras, vivas y en buen estado, pueden sostener las 
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suyas junto a las de quienes trabajan en las teorías del aprendizaje animal. A medi- 
da que las teorías globales pierden su atractivo, y las hipótesis en miniatura se de- 
sarrollan cada vez más para tareas específicas del aprendizaje, la posición ecléctica 
del funcionalismo ofrece un aliciente cada vez mayor a los psicólogos experimenta- 
les contemporáneos. 
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1 


El condicionamiento 
operante 


de Skinner 


En una serie de artículos iniciados en 1930, B. F. Skinner propuso una formula- 
ción de la conducta originada a partir de observaciones del comportamiento animal 
en un experimento que ideó: la actividad de presionar una palanca por parte de una 
rata colocada en una jaula especialmente diseñada, que después se llamó “caja de 
Skinner”. El investigador creía que en esta situación podrían examinarse y reve- 
larse muchos de los conceptos importantes del control de la conducta. El éxito de 
sus procedimientos y demostraciones analíticas ha cautivado a varias generacio- 
nes de “'seguidores””, Skinner aislaba algunos fenómenos sumamente repetibles 
en el condicionamiento (muchos de los que Pavlov y Thorndike ya habían identifi- 
cado y estudiado), y los utilizaba como base para aquellos conceptos empleados en 
el análisis de formas más complejas de conducta. Es esta colección de conceptos, 
principios y distinciones, así como una filosofía particular de la ciencia y de la es- 
trategia de investigación, lo que caracteriza al enfoque ““skinneriano'* de la psico- 


gía. 

El sisterna de Skinner constituía un declarado conductismo, por lo cual se le exa- 
mina en esta sección de) libro. Una de sus ideas básicas es que la conducta com- 
pleja (neurosis, conocimiento de sí mismo, pensamiento, resolución de proble- 
mas), cuando se analiza apropiadamente. puede interpretarse en términos de la 
compleja interacción de conceptos y principios elementales. Este supuesto es 
muy semejante al que motivó los esfuerzos de Clark Hull y de muchos otras teó- 
Ticos del aprendizaje. Pero mientras Hull se interesaba en las variabies intervi- 
nientes y en la teorización hipotético deductiva. Skinner rechaza los ““constructos 
teóricos” por innecesarios. Por ejemplo, desecha una versión de estímulo- 
respuesta del conductismo y del asociacionismo, y más bien se dedica a los análisis 
informales (por ejemplo, de las prácticas culturales) o los análisis experimentales 
de varias conductas complejas, como la lectura. 

Skinner es uno de los protagonistas más convincentes de la metodología condut- 
tista que la psicología haya visto jamás. Repudia las explicaciones mentalistao cog- 
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noscitivista de la conducta, o aquellas que atribuyen la causación de la conducta a 
fuerzas psíquicas internas de cualquier tipo. Skinner argumenta que sólo compren- 
demos una parte de la conducta cuando hemos aprendido a sintetizar (entrenar) 
esa conducta desde el principio, y a predecirla y controlarla. En su opinión, las 
explicaciones mentalistas son inútiles porque no nos dicen cómo manipular va- 
riables a fin de sintetizar o controlar la conducta. Además, resultan incompletas, y 
su aceptación sólo pospone la realización de un análisis funcional apropiado de la 
conducta. Un análisis de esta índole implica identificar y aislar las variables am- 
bientales de las cuales la conducta es una función legítima. 

Aunque el primer trabajo de laboratorio de Skinner se llevó a cabo con ratas que 
presionaban palancas para obtener bolitas de comida en una cámara de trabajo, la 
base experimental del análisis se ha ampliado gradualmente hasta incluir a otros 
animales, seres humanos de todas las edades, y situaciones y conductas que di- 
fieren cada yez más de su fundamento original (por ejemplo, máquinas de ense- 
ñanza y psicoterapia conductual). Skinner ha sostenido también una posición con- 
ductista peculiarmente precisa acerca del análisis de los términos psicológicos del 
sentido común como el no mismo, el autocontrol, el darse cuenta; pensamiento, re- 
solución de problemas, compostción, fuerza de voluntad, y muchos otros conceptos 
psicodinámicos como represión, racionalización y demás mecanismos de defensa 
del yo. Además, propuso un análisis particular de la conducta verbal del que es- 
cucha así como del que habla, que fue motivo de cierta controversia. Ha llevado 
sus ideas un paso más allá en el análisis de las nociones del libre albedrío, determi- 
nación interna y valores sociales, y ha discutido la forma en que podríamos dispo- 
ner las prácticas culturales al diseñarlas de tal modo que se construya una so- 
ciedad '“mejor””, de acuerdo con ciertos valores humanitarios. Por esta razón, y 
gracias a sus populares libros Walden Dos y Más allá de la libertad y la dignidad, 
es probable que sea más conocido por el gran público que cualquier otro psicólogo 
contemporáneo. 

En un solo capítulo no es posible reseñar las numerosas contribuciones de Skin- 
ner durante su larga carrera de más de 45 años de actividades científicas. Pondre- 
mos el acento en la visión histórica, para destacar su primer conjunto de concep- 
tos y principios. Más adelante se verá brevemente el análisis skinneriano de diver- 
sas habilidades complejas. En la obra inicial de Skinner, La conducta de los orga- 
nismos (1938), aparecieron las ideas centrales que habría de aplicar sólo con lige- 
ras variaciones a casos más complejos durante los siguientes cuarenta años. La 
primera parte de nuestra reseña se refiere fundamentalmente a esta obra, de gran 
significación histórica. 


CONDUCTA RESPONDIENTE Y OPERANTE 


La diferencia esencial entre el sistema de Skinner y la psicología tradicional del 
estímulo-respuesta radica en la distinción entre la conducta respondiente y la con- 
ducta operante. Desde Watson, la psicología del estímulo-respuesta había reforza- 
do el aforismo de '*ningún estímulo, ninguna respuesta””, al presuponer la presen- 
cia de estímulos cuando ocurría una respuesta, aun cuando ninguno de ellos fuera 
identificable. Si el experimentador tenía medios para detectarlos, no se dudaba de 
que los estímulos estuvieran presentes para provocar tales respuestas. Skinner 
creyó que este método de hechos forzados era indeseable e innecesario, y propu- 
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so que se distinguieran dos clases de respuestas: las respuestas provocadas y las 
respuestas emitidas. 

Aquellas respuestas provocadas por estímulos conocidos se clasifican como res- 
pondientes. La contracción de la pupila a la luz y la salivación al jugo de limón en la 
boca sirven como ejemplos de reflejos respondientes. Hay una segunda clase de 
respuestas que no necesitan estar correlacionadas con ningún estímulo conocido. 
Para diferenciarlas de las respondientes, estas respuestas emitidas se denominan 
operantes. Como la conducta operante no es provocada por estímulos reconocidos, 
su fuerza no puede medirse de acuerdo con las leyes usuales de los reflejos, que 
se estipulan como funciones de sus estímulos provocadores. La tasa de respuesta 
se usa como medición de la fuerza operante en una situación dada. 

Una operante puede, como lo hace a menudo, adquirir una relación con la esti- 
mulación previa. En ese caso se transforma en una operante discriminada; el 
estímulo se convierte en una ocasión para la conducta operante, pero no es un 
estímulo provocador como en el caso de un verdadero reflejo. Una ilustración 
simple de una operante coordinada con un estímulo sería un experimento de tiem- 
po de reacción, como comúnmente se realiza en el laboratorio psicológico. La corre- 
lación entre el estímulo y la respuesta puede cambiarse con facilidad, como cuando 
se le dice al sujeto que oprima la llave en lugar de levantar el dedo que apoya en 
ella. La mayor parte de la conducta humana es de naturaleza operante: las conduc- 
tas de limpiar un piso, conducir un automóvil, o escribir una carta muestran pocas 
características respondientes. 

Aunque Skinner es conductista, no es un psicólogo E-R. Su nación de la operan- 
te se refiere a la conducta que manifiestamente no es provocada por ningún 
estímulo, sino que es emitida. La idea E-R sugiere un organismo pasivo desde el 
cual un estímulo distinto dispara una conducta específica, y Skinner rechaza esa 
opinión así como sus alusiones mecanicistas para la conducta operante. Sin embar- 
go, se dice que un estímulo discriminativo ““establece la ocasión*” para una ope- 
rante, o que ejerce '*control de estímulo”” sobre una operante, y eso ubica a Skin- 
ner en la dirección de los téoricos £-R. Pero Skimer opina que el concepto de la 
asociación es innecesario. El estímulo y la respuesta pueden estar ““asociados'” 
(ocurrir juntos) en el mundo y traducirse a un estado de preparación para ejecutar 
la respuesta; sin embargo, en su opinión la idea de un vínculo interno entre las re- 
presentaciones de la situación y la respuesta constituyen sólo una carga. 


Dos tipos de condicionamiento 


Se afirma que hay dos tipos de respuesta relacionados con los dos tipos de con- 
dicionamiento, y que el condicionamiento de la conducta respondiente es del *“tipo 
E”, porque el reforzamiento está correlacionado con los estímulos. El estímulo 
condicionado (por ejemplo, un sonido) se presenta junto con el estímulo incondi- 
cionado (por ejemplo, comida), y provoca así la respuesta (en este caso, la saliva- 
ción). El evento reforzante que interesa a Skinner es la presentación del estírmlo 
incondicionado, no la respuesta a él. Skinner asignó el nombre de “tipo E” al 
condicionamiento pavloviano o clásico, pero este término ha perdido actualidad. 

El “tipo R””, por su parte, es el condicionamiento instrumental u operante, que 
Skinner considera mucho más importante. La letra R se usa para dirigir la atención 
a la relevancia del término de la respuesta en la correlación con el reforzamiento. 
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El arreglo experimental que empleó originalmente era el de la presión de una pa- 
lanca. Para un organismo hambriento, esta respuesta puede fortalecerse si va se- 
guida de comida. No es el estímulo de la palanca sino la respuestas de oprimirla lo 
que se correlaciona con el reforzamiento. La respuesta condicionada no se aseme- 
ja a la respuesta al estímulo reforzante; su relación con el estímulo reforzante es 
que la respuesta hace que aparezca e! reforzador. En el condicionamiento operan- 
te, el reforzamiento no puede producirse a no ser que aparezca la respuesta condi- 
cionada, el reforzamiento es contingemie a la respuesta. Como dijimos en el 
capítulo 3, este arreglo terminó por llamarse condicionamiento instrumental a fin 
de distinguirlo de aquellos del condicionamiento clásico (Hilgard y Marquis, 1940, 
págs. 51 274), 

Las leyes del condicionaniento operante son similares a las del condicionamien- 
to clásico; ambas incluyen una ley del condicionamiento y una de la extinción. La 
ley de Skinner del condicionamiento operante puede compararse con la ley del 
efecto, de Thorndike: sí a la ocurrencia de una operante sigue la presentación de un 
estímulo reforzante, su fuerza se incrementa (Skinner, 1938, pág. 21). Obsérvese 
que una situación reforzante se define por su estímulo; nada se dice acerca de los 
efectos secundarios satisfactorios o sobre la reducción de impulso. Skinner 5u- 
giere, además, (1938, pág. 112) que el condicionamiento del tipo R puede limitar- 
se al comportamiento esquelético, y el tipo E alas respuestas autónomas. 


Reforzadores primarios positivos y negativos 


Un reforzador se define por sus efectos, Cualquier estímulo es un reforzador si 
incrementa la probabilidad de una respuesta. Los estímulos que actúan como re- 
forzadores son de dos clases (Skinner, 1953, pág. 73): 


1. El reforzamiento positivo ocurre cuando un estímulo presentado a continuación de 
una respuesta operante fortalece la probabilidad de esa respuesta. La comida, el agua, el 
contacto sexual, se clasifican como reforzadores positivos para individuos privados de 
ellos. 

2. El reforzamiento negativo se produce cuando la eliminación de un estímulo aversivo 
después de una respuesta operante fortalece la probabilidad de esa respuesta. Un ruido 
alto, una luz muy brillante, el calor o el tro extremoso, la descarga eléctrica son ejemplos 
de estímulos aversivos. Obsérvese que el tipo de reforzamientos se clasifica teruendo en 
cuenta si la presentación o eliminación de un estímulo fortalece una operante anterior. Un 
estímulo aversivo es aquel que provoca que el organismo aprenda algo para escapar de él. 
Como se define aqui, el castigo r0 es reforzamiento negativo. Se trata más bien de un 
arreglo experimental en el cual la presentación de un estímulo aversivo es contingente a 
una respuesta designada. En una sección postetior examinaremos el castigo desde la 
perspectiva skinneriana, 


Skinner además reconocía a los reforzadores condicionados basados en el parea- 
miento de estímulos neutrales con reforzadores primarios. El reforzamiento con- 
dicionado también se verá en una sección posterior. 

A otros psicólogos los ha inquietado responder a una pregunta: ¿por qué es re- 
forzante un reforzador?, pero Skinner no muestra gran interés en ella. Quiere sa- 
ber por qué cambia la conducta, y descubre que los reforzadores tienen una im- 
portante intervención. De modo bastante provisional, acepta una explicación del 
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reforzamiento en términos de funciones evolutivas y adaptativas, pero no cree 
que esto sea de gran ayuda en el análisis funcional detallado de lo que en verdad 
ocurre (1953, págs. 81-84). 


ESTUDIOS ACERCA DEL 
CONDICIONAMIENTO OPERANTE 


Como hemos visto, para estudiar el condicionamiento operánte Skinner diseñó 
un aparato especial: una caja a prueba de ruidos dentro de la cual una rata puede 
oprimir una palanca para obtener una bolita de comida. La palanca está conectada a 
un sistema de registro que trata una gráfica del número de presiones de palanca en 
relación con el tiempo que el animal permanece en la caja. En esta situación se ob- 
tienen resultados notablemente consistentes y “legítimos'*. En el experimento 
pueden efectuarse modificaciones, de modo que la comida no se entregue cada 
vez que se presiona la palanca. Las consecuencias de estas alteraciones y de intro- 
ducir otros cambios en la situación se han explorado de modo sistemático. La **ca- 
ja de pichones'” es otra disposición experimental para obtener un registro de res- 
puestas del picoteo de las palomas sobre una llave ligera de plástico montada en 
una pared que se refuerza al recibir granos de alimento. 

La consecuencia de reforzar una operante es un aumento en su tasa o probabili- 
dad de ocurrencia por unidad de tiempo. Como por lo común el animal permanece 
continuamente en presencia de la palanca o llave de respuesta, a esta circunstan- 
cia se le denomina situación de respuesta libre o de operante libre. Los ensayos 
discretos no se demarcan, y como la respuesta se produce en cualquier momento, 
la tasa de respuesta por unidad de tiempo es la medición observada. Dependiendo 
de los programas de reforzamiento y de muchos otros factores, esta tasa de res- 
puesta puede variar en un amplio rango, y nos interesa saber cuál será la ejecución 
de estado estable que las contingencias de reforzamiento particular producen y 
mantienen. Más adelante retomaremos este tema. 

Skinner opinaba que la adquisición de esta operante simple, ocurriría en “unen- 
sayo'” o instantáneamente, si se eliminaban los factores extraños y si el animal 
estuviera preparado de forma adecuada para “un ensayo'', Por ejemplo, las ex- 
periencias anteriores en la caja podrían usarse para habituar comportamientos 
rrelevantes exploratorios o de miedo, y el “entrenamiento de comedero” inicial 
condicionaría al animal hambriento a acercarse al recipiente y comer al sonido del 
dispensador de alimento, que descarga una bolita alimenticia en el mismo. Si se 
han cuidado estos componentes conductuales antes de introducir la palanca y de 
conectarla con el alimentador, entonces el condicionamiento de presión de palanca 
es muy rápido, cuando no inmediato. Según Skinner (al igual que Guthrie, véase el 
capítulo 4), el condicionamiento de presionar la palanca generalmente parece gra- 
dual, ya que constituye una cadena de muchos comportamientos componentes, y 
las "curvas de aprendizaje'? revelan más cerca de la “caja problema” y las condi- 
ciones de preparación previa de elementos de la cadena de respuesta, de lo que 
revelan acerca de las “leyes”” básicas. 

Así como el reforzamiento que ocurre para una operante la fortalece, se afirma 
que el no reforzamiento después de la respuesta la debilita, y una serie prolongada 
de respuestas no reforzadas da lugar a la gradual disminución de la tasa de res- 
puesta mediante el proceso denominado de extinción experimental: el animal deja 
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de presionar porque esta acción ya no va seguida de reforzamiento. Ál igual que 
otros investigadores, en un camienzo Skinner pensó (1938, pág. 26) que el núme- 
ro de respuestas emitidas durante la extinción constituía una medición de la fuerza 
operante; sin embargo, sus propios estudios del reforzamiento intermitente hi- 
cieron que abandonara la idea. En 1950 comprendió, tal vez antes que otros, que 
podemos entrenar diferencialmente a un organismo ya sea a “resistir”? o a “de- 
sistir rápidamente”? en extinción, lo cual depende de la manera en que se progra- 
men las recompensas y las no recompensas durante el entrenamiento. 


DISCRIMINACIÓN DE ESTÍMULOS Y RESPUESTAS 


Skinner también ha dirigido extensas investigaciones acerca de la discriminación 
del estímulo, En términos conductuales, se dice que un organismo discrimina 
entre dos o más estímulos cuando aprende a responder diferencialmente (en dis- 
tintas formas o en diferentes tasas) a cada uno de los estímulos. Skinner se refiere 
a este fenómeno como control de estímulo, y a que la presentación o eliminación de 
un estímulo discriminativo dado controla la ocurrencia de un patrón particular de 
respuesta o de su tasa. Un segundo tipo de aprendizaje es la diferenciación de la 
respuesta, en la cual la forma de la respuesta (su topografía) o su intensidad, ampli- 
tud o latencia se alteran mediante el reforzamiento diferencial. Skinner presupone 
que las complejidades de la conducta pueden comprenderse de acuerdo con las 
discriminaciones de estímulo y las respuestas diferenciadas dispuestas en cadenas 
opatrones adecuados. 


Discriminación de estímulos 


Para ilustrar el punto de vista de Skinner, el experimento estándar de opresión 
de palanca sirve para describir los propósitos del condicionamiento discriminato- 
rio. Supóngase que la opresión de la palanca suministra una bolita de comida en 
presencia de un estímulo positivo, como una luz, y no la entrega en ausencia de 
ese estímulo discriminativo. La rata aprende a responder sólo cuando ve la luz. Al 
igual que Spence y Hull, Skinner ofrece el análisis usual del aprendizaje por discri- 
minación en términos de reforzamiento, extinción y generalización del estímulo. 
Pero observa que la luz no provoca la respuesta, en el sentido de que una ceniza 
en el ojo causa la irrupción de lágrimas, o el hecho de tocar una sartén caliente ori- 
gina que retiremos la mano. La diferencia entre un estímulo discriminativo como 
ocasión para una respuesta, y la provocación real de una respuesta puede aclarar- 
se mediante un ejemplo. Tomo un lápiz que está sobre el escritorio pero sólo lo 
hago cuando el lápiz está allí y lo quiero; no lo tomo sólo porque se encuentra allí. 
Aunque el lápiz no provoca el que lo tome, tiene algo que ver con ello, Si hubiese 
oscuridad completa, tal vez lo buscaría, a tientas, ya que me faltarian estímulos 
discriminativos. El lápiz no provocá que yo lo busque ni con la luz encendida ni a 
oscuras, Es sólo la ocasión para tomarlo (Skinner, 1938, pág. 178). 


Aprendizaje de diseriminación sin errores 
Según el punto de vista clásico, la discriminación se logra al extinguir las res- 
puestas generalizadas a los estímulos no reforzados, £—. Por ejemplo, en la 
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teoría de Spence la frustración repetida mediante el no reforzamiento de la res- 
puesta a E— causa que la inhibición se asocie con E—. 

Terrace (19634), un discípulo de Skinner, diseñó un procedimiento para ense- 
ñar una discriminación perfecta a una paloma, de tal modo que nunca responda a 
E-— durante todo el experimento; dicho de otra forma, nunca comete un “error”. 
Se usan diferentes luces de colores sobre la llave de picoteo, que sirven como el 
E + y el E—. El procedimiento implica: introducir E— mucho antes de que la 
respuesta a E + esté bien condicionada, y que la introducción gradual de E— se 
inicie con duraciones muy breves y con intensidades muy débiles. Durante ensa- 
yos sucesivos, la intensidad y duración de los ensayos de estímulo E— se incre- 
mentan gradualmente hasta llegar a sus valores totales. El método depende en 
parte de ciertas particularidades de las palomas, como el hecho de que es poco 
probable que picoteen una llave oscura. Sia embargo, se han utilizado métodos si- 
milares con seres humanos. 

A) usar este simple procedimiento, Terrace demostró que es posible lograr una 
discriminación perfecta sin la ocurrencia de una sola respuesta no reforzada al E—. 
En contraste, supongamos que se introduce el E— —como suele suceder— para la 
duración total, y la brillantez completa después de que la paloma tuvo diversas se- 
siones de exposición al E + y quedó bien condicionada. En estas circunstancias, el 
anima) puede emitir varios miles de respuestas al E— antes de aprender una con- 
ducta diferencial aceptable. Así, la diferencia producida por el procedimiento 
simple de Terrace es verdaderamente enorme si pensamos en términos de facilí- 
dad en el entrenamiento de una discriminación o también, por inferencia, en la can- 
tidad de frustración emocional que el sujeto se ha ahorrado, 

En un experimento relacionado, Terrace (19630) demostró que una discrimina- 
ción aprendida sin errores, por ejemplo, frente a claves de color rojo versus ver- 
de, podía transferirse a nuevos estímulos (una barra vertical blanca como positivo 
y una barra horizontal como negativo) mediante un método especial. Este método 
(véase la figura 7.1) consistía en: e) superponer primero la barra vertical sobre la 
clave roja positiva, y la barra horizontal sobre la clave verde negativa; y 6) 
después de varias sesiones de tales condiciones de superposición, desvanecer gra- 
dualmente (debilitamiento) los colores tajo y verde de las claves, para finalizar 
sólo con la barra vertical o la horizontal sobre tna clave oscura. Medimte este 
procedimiento, el control de estímulo se transfiere del rojo versus el verde a las 
barras vertical versus horizontal, y aquí, de nueva cuenta, no ocurren errores en 
el transcurso de la transferencia gradual. Es significativo el hecuo de que Terrace 
Juera incapaz de entrenar una discriminación vertical versus una horizontal desde 
el principio, sin errores (al manipular la brillantez de £--), Esto sugiere que si ha de 
entrenarse una discriminación difícil, un método óptimo consiste en entrenar sin 
errores otra discriminación que de por sí sea sencilla para el sujeto (como los colo- 
res lo son, sin duda, para las palomas), y entonces superponer y desvanecer los 
estímulos más difíciles. Terrace señala la importancia de estos resultados para la 
afirmación de Skinner de que el arreglo óptimo de las secuencias de instrucción 
programada (en las máquinas de enseñanza) es aquelia en la cual el estudiante nun- 
ca comete un error al responder preguntas durante el aprendizaje. 

Hay varias secuelas llamativas de la ejecución de la discriminación sin errores, 
que Terrace ha recalcado al compararlas coa lo que se obtiene por el procedimien- 
to acostumbrado de errores aleatorios. Ante todo, la prupia ejecución discrimina- 
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Figura 7.1. Hustración de las llaves de estimulos para paloma usadas para trasladar el 
control de una discriminación roja (+) en contraposición a una verde (—) hacia una 
línea vertical (+) contra otra horizontal (—3 El procedimiento se hace gradualmente, 
de modo que el animal nunca cometa un errof, 


tiva es muy superior. Los animales entrenados mediante el método sin errores ra- 
ras veces responden al £—, mientras que los pájaros cuya rutina de entrenamiento 
está salpicada de errores continúan mostrando indefinidamente arranques esporá- 
dicos de respuestas a £—. Segundo, la observación revela que los pájaros propen- 
sos al error muestran una gran cantidad de comportamiento emocional en £— lo 
cual sugiere que quizá sea un estímulo aversivo para ellos, en apariencia debido a la 
frustración generada por la respuesta no reforzada. En comparación, los pájaros en- 
trenados sin errores en el estudio de Terrace demostraban relativamente paco 
comportamiento emocional en £—. Tercero, si al animal se le inyecta una droga 
tranquilizante llamada cloropromazina, se “liberan'* grandes cantidades de respues- 
tas a E— en las aves con propensión al error, pero no én las del entrenamiento sin 
errores. Cabe suponer que el tranquilizante disipa parte de la emoción que ha inhúbi- 
do las respuestas a £— en los animales entrenados con errores. Cuarto, los pájaros 
entrenados sin errores no muestran un efecto de contraste conductual (tasas más rá- 
pidas a £+ porque éste se alterna con £—), mientras que las aves propensas al 
error sí lo muestran; sin embargo, sia un pájaro entrenado sin error se le induce a 
que comience a cometer errores en £— (es decir, mediante la abrupta transferencia 
de colores a líneas que hemos mencionado), entonces comienza a mostrar contraste 
al incrementar su tasa de respitesta a £+. Quinto, un gradiente de generalización 
del estímulo obtenido después del entrenamiento de discriminación muestra una 
“desviación de pico'” en los pájaros propensos al error, pero no en aquellos sin erro- 
res. La desviación de pico se refiere al hecho de que la tasa máxima de respuesta no 
se produce en £ + sino en un valor desplazado desde E +, en una dirección que se 
aleja de £—, En la figura 7,2 se muestra este efecto en el experimento de Terrace 
(1964). El continuo de estímulo es la longitud de onda de la luz (que corresponde a 
los cambios de color para el ojo humano) medida en milimicrones. El E'+ estaba en 
580 y el E— en 540 milimicrones. Obsérvese que la tasa pico de respuesta durante 
la prueba de generalización es de 580 (ef £ +) para los pájaros entrenados sin erro- 
res, pero cambia a 5%) para aquellos entrenados con propensión al error. 

¿Qué significa todo esto? ¿Cuál es la mejor interpretación? Una explicación sería 
la siguiente: la discriminación sin errores es posible usando el principio del canibio 
de asociación, de Thorndike, que en este caso es el mismo que el del condiciona- 
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Figura 7.2. Gradientes de generalización obtenidos en tres diferentes condiciones 
que relacionan la tasa de respuesta con las variaciones en la longitud de anda (color) 
de una luz proyectada sobre la llave de picoteo. £l gradiente inferior se ohtuvo a can- 
tinuación del condicionamiento simple en 580 milicrones sin un procedimiento de 
discriminacion. Los antros dos gradientes seguían al entrenamiento en discriminación 
en 580 milicrones como E+ y 540 como £—, un procedimiento implicaba errores al 
£-, y el otro no. Una desviación de pico aparece en el primer gradiente porque la res- 
puesta a 590 milicrones era mayor que 580, el E+ del entrenamiento (tomada de To 
rrace, 1964). 


miento, de Guthrie, mediante la simple contigúidad de la última respuesta dada an- 
tes de que termine un estímulo. Debido a las experiencias pasadas de extinción 
con el picoteo en un fondo oscuro homogéneo, al comienza del experimento la pa- 
loma no picotea el cuadro oscurecido en la pared oscura. Como el color E— se pre- 
sentaba inicialmente débil y con duraciones breves, la probable respuesta a estas 
presentaciones E— es la retirada o la “inmovilización”, y tal comportamiento es lo 
que se condiciona a E—, Ésta no respuesta se generaliza entonces a los colores E— 
más brillantes. El contraste conductual y la desviación de pico son efectos que depen- 
den de la conversión de E— en un estímulo aversivo, lo que suele lograrse median- 
te la frustración generada por la respuesta no reforzada a E—. Como el procedi 
miento sin errores produce relativamente pocas respuestas no reforzadas, se pro- 
voca relativamente poca frustración o hay escasa aversión condicionada a E—; y 
por ello en este caso no ocurren el contraste y la desviación de pico. En concor- 
dancia con este razonamiento, Grusec (1965) descubrió que los pájaros entrena. 
dos sin error mostraban desviaciones de pico si recibían descargas eléctricas en 
asociación con E—, que así se convertía en estímulo aversivo. 
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No todos aceptan el estatus especial y las propiedades del aprendizaje por 
discriminación sin errores. Rilling (1977) argumenta que un error es una parte ar- 
bitrariamente definida de una cadena completa de respuestas (es decir, cerrar el 
interruptor), y que las partes iniciales de la cadena pueden ocurrir regularmente al 
E-— sin que se registren. Por lo tanto, sostiene que no deberíamos asignarle una 
importancia tal a los errores registrados. Además, el aprendizaje sin errores está 
definido de modo arbitrario (muchos pájaros entrenados con los “*procedimientos 
sin errores”* cometen algunos). En consecuencia, para Rilling no hay una razón 
que justifique la acentuada distinción cualitativa entre el aprendizaje propenso al 
error y el aprendizaje sin errores. Además, la investigación de Rilling y de sus co- 
legas establece: 


El comportamiento de los sujetos con pocos errores no es fundamentalmente distinto 
del que muestran los sujetos con muchos errores, a excepción de la diferencia en número. 
[Muchos subproductos del aprendizaje por discriminación] se han obtenido en su totalidad 
independientemente de si la discriminación se adquiría con errores o sin ellos. Por lo tanto, 
una clasificación teórica basada en la distinción entre el aprendizaje con errores y el apren- 
dizaje sin errores no resulta útil (Rilling, 1977, pág. 475). 


Rilling y sus colegas descubrieron que los pájaros entrenados sin errores 
mostraban una aversión significativa al E—, en el sentido de que trabajarían para 
suspenderlo y reemplazarlo por una clave oscura entre los ensayos. Las aves 
entrenadas sin errores también atacarían a un ““pájaro víctima”” encerrado en la 
cámara de condicionamiento operante durante el £—, más que como lo harían du- 
rante un estímulo neutral antes del condicionamiento. Si al ataque se le considera 
como un signo de emoción (*“colera””), entonces las palomas sin errores son un 
tanto emocionales durante £-—, frustradas posiblemente sólo por la ausencia del 
E+ enn contexto donde este E'+ ocurre repetidas veces. Asimismo, los inves- 
tigadores frecuentemente han descubierto contraste conductual cuando el E— era 
un oscurecimiento total de la cámara, donde no ocurrían respuestas al E—. Así se 
ha puesto en duda la singularidad de los efectos debidos a los procedimientos sin 
errores, de Terrace. 

Ya sea que el entrenamiento por discriminación sin errores produzca o no cam- 
bios cualitativos en los fenómenos, la significación práctica del procedimiento aún 
se sostiene. Demuestra que el procedimiento convencional de extinción puede 
eludirse al establecer una discriminación, y que la ejecución así obtenida es mejor 
que las que suelen realizarse, El procedimiento de Terrace plantea un punto de 
vista que se refiere al carácter óptimo, y formula preguntas acerca de una mejor 
disposición de las condiciones del entrenamiento, que permita al sujeto formar al- 
gún criterio de bueña ejecución. Aquí las posibles metas serían diseñar secuencias 
de entrenamiento para perfeccionar la habilidad de la ejecución lograda, la veloci- 
dad al introducir un cambio determinado en la ejecución, la producción de un cam- 
bio deseado con un mínimo de errores, v un mínimo de frustración, de dificultad, 
etcétera, Tal investigación arroja resultados de importancia para los educadores, 
los psicoterapeutas y otros especialistas interesados por la ingeniería conductual 
práctica. 
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Diferenciación de una respuesta; 
moldeamiento 


La diferenciación de respuesta se refiere al reforzamiento de ciertas propiedades 
de una respuesta, como su velocidad, duración o vigor. Por ejemplo, Skinner 
(1938) entrenó a algunas ratas para que presionaran y mantuvieran oprimida una 
palanca durante largo tiempo a fin de obtener una recompensa y a otras las entre- 
nó para que presionaran la palanca con una fuerza por encima de un criterio dado. 
De modo similar, veremos más adelante en el análisis de la ejecución en un pro- 
grama RDB, es pasible entrenar al sujeto a responder selectivamente a una ta- 
sa lenta o rápida, El principio es el del reforzamiento operante, pero se aplica al ni- 
vel de las variaciones intensas de la respuesta (lo que Logan denomina respuestas 
micromolares, que se examinaron en el capítulo 5). Par ejemplo, en la diferen- 
ciación de una presión vigorosa de palanca, primero reforzanmos cualquier opresión 
con lo cual se proporciona una distribución de fuerzas variables. Entonces estable- 
cemos un criterio de fuerza baja y recompensamos sólo aquellas presiones que ex- 
ceden a tal criterio. El efecto de esta restricción es extinguir las presiones más 
débiles y fortalecer las de mayor vigor, de modo que la distribución total de la 
fuerza cambia hacia valores más elevados. Entonces el criterio del experimenta- 
dor puede incrementarse de nuevo, y otra vez, y así '“moldear*” gradualmente las 
presiones de palanca del animal hacia valores más altos. Por supuesto, también 
puede imponerse un límite tope, de manera que las fuerzas por encima del mismo 
no sean reforzadas; y las respuestas de diferentes fuerzas pueden condicionarse a 
diversos estímulos diferenciales (Notterman y Mintz, 1962). Es obvia la importan- 
cia de tales resultados para el aprendizaje de habilidades humanas complejas. Por 
ejemplo, nuestra comunidad social moldea el habla a una velocidad y altura particu- 
lares en situaciones deterrminadas (susurrar en los funerales, gritar en los partidos 
de beisbol) y castiga las desviaciones graves de esas normas. 

Otro tipo de moldeamiento ocurre cuando una nueva respuesta cualitativa o una 
secuencia novedosa de componentes conductuales se ensambla en una ejecución 
unitaria. Aquí se usa la noción del encadenamiento, que desempeñó un papel impor- 
tante en los análisis de Skinner. 


Cadenas de respuestas 


Skinner (1938, 1953) sostiene que muchos actos son, de hecho, una secuencia 
de movimientos en los que cada segmento proporciona estímulos de retroalimen- 
tación (externos e internos), que se vuelven discriminativos para el siguiente segmen- 

to de la respuesta. Así, el acto puede concebirse como una cadena de pequerías Uni 
dades E%-=R. Incluso la respuesta simple de presionar una palanca puede consi- 
derarse una cadena. En su discusión del encadenamiento, Keller y Schoenfeld 
(1950, págs. 197-208) citan como ejemplos ilustrativos los seis vínculos que apa- 
recen en el cuadro 7.1. En esta cadena cada respuesta produce el estímulo discri- 
minativo para la siguiente. Para fines analíticos, la cadena puede ser más o menos 
elaborada. 

¿Opera la cadena como una unidad? La rata bien condicionada pasa las transicio- 
nes de modo tan uniforme que parece estar dando una sola respuesta, y no seis. 
Pero la independencia de las unidades puede comprobarse experimentalmente. 
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CUADRO 7.1. Enumeración de los componentes de estimulo-respuesta en 
ta cadena de respuestas de presión de palanca y de comer, 
(tomado de Keller y 5choenfeld, 1950). 


Número de la Estímulo 
Operante discriminativo Respuesta de la rata 
1 Localización de la La rata se acerca al 
palanca . frente de la caja 
2 Palanca visual Se alza sobre las patas traseras; coloca 
las patas delanteras sobre la palanca 
3 Palanca Táctil Presiona la palanca que activa al 
dispensador de comida 
4 Ruido de! aparato Baja las patas delanteras a) comedero 
5 Bolita de Alimento Toma la bolita con los dientes y 
visible las patas delanteras 
6 Bolita de alimento Mastica la bolita 
en el hocico 


1. Si eliminamos sólo el estímulo para las unidades finales de la cadena (la bolita 
de comida), como se hace en una forma de extinción, los vínculos iniciales de la ca- 
dena se debilitan gradualmente, pero los últimos no se afectan. Es decir, la rata 
toma y come una bolita exactamente igual que antes. 

2. Si eliminamos ahora los eslabones cuarto y quinto de la cadena (el ruido del 
aparato y la bolita), y llevamos a cabo la extinción, descubrimos otros detalles. La 
reintroducción del ruido después de la extinción refuerza de nuevo la opresión de 
la palanca. Por lo tanto, durante el condicionamiento, el estímulo del cuarto esla- 
bón (el ruido del aparato) se ha convertido en un reforzador condicionado. Áde- 
más, la extinción de los eslabones precedentes en la cadena no ha extinguido las 
propiedades reforzantes del cuarto eslahón. 

Este tipo de estudio funcional y experimental aísla unidades de la cadena que 
preservan cierta independencia del todo; estas unidades son parte de aquélla, pe- 
ro su carácter distintivo no es por completo arbitrario. Parecería posible re gistrar 
las respuestas separadas y no sólo la final. La unidad apropiada para el estudio ex- 
perimental resulta tener, de hecho, una medición de arbitrariedad. Medir o no una 
respuesta de la cadena, o seis respuestas, o muchas más es una cuestión de con- 
veniencia; evidentemente, el experimentador ejercita cierta selectividad. 

Este análisis del encadenamiento sugiere no sólo las leyes para “descomponer” 
cadenas establecidas, sino también un medio de entrenar al organismo en nuevas 
cadenas, al vincular nuevas secuencias de componentes conductuales, de la misma 
forma en que podríamos ensartar cuentas de distintos colores para crear collares 
de diseños nuevos. La regla básica consiste en desarrollar la cadena de una unidad 
ED-R a la vez, comenzando por el reforzamiento y trabajando hacia atrás. El *'re- 
forzamiento”” para el aprendizaje de la siguiente respuesta en la cadena es la pre- 
sentación del E” para el resto de la misma. Si la forma exacta de respuesta no 
ocurre inicialmente en una tasa apreciable, se reforzará cualquier conducta que se 
aproxime a la deseada; entonces, cuando la variación ocurra antes de dar reforza- 
miento se requerirá de una forma incluso más aproximada a la deseada. Á través 
de sucesivas aproximaciones el método de moldeamiento permite que la conducta 
finalmente aprendida sea muy diferente de la que se emitió en un principio. 
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Los entrenadores de animales están muy versados en este métudo. Como un tour de 
force he entrenado a una rata para que ejecute una serie elaborada de respuestas inspira- 
das en modernos trabajos con monos antropoides. La conducta consiste en tirar de un 
arillo para obtener una bolita, alzaria con las patas delanteras, llavarla hasta un tubo que 
_se proyecta a 5 centrímetros sobre el suelo y dejarla caer dentro del mismo. Cada paso 
úe este proceso se logró mediante una serie de aproximaciones, ya que las respuestas 
componentes no $e encontraban en el repertorio original de la rata (Skinner, 1938, págs. 
339-340)! 


Mediante el moldeamiento a través de aproximaciones sucesivas se hicieron va- 
rias demostraciones de todo tipo de habilidades novedosas y complejas que se les 
enseñan a diversos animales. Skinner cree que de esta forma se ha sintetizado la 
mayor parte de nuestras habilidades complejas. 


PROGRAMAS DE REFORZAMIENTO 


En la vida cotidiana el reforzamiento de la conducta operante no es regular y uni- 
forme. El pescador no atrapa un pez en cada ocasión que arroja el anzuelo, y el 
agricultor no siempre levanta una buena cosecha después de la siembra; no obs- 
tante ninguno de los dos deja de pescar o de sembrar, Por esto, el problema del 
mantenimiento o del fortalecimiento de ina respuesta mediante el reforzamiento 
intermitente es algo más que una mera curiosidad de laboratorio. Skinner ha explo- 
rado exhaustivamente dos clases principales de reforzamiento intermitente, deno- 
minados ahora programas de intervalo y programas de razón. 

Los programas de intervalo fijo se arreglan con la ayuda de un reloj: el reforza- 
miento se proporciona a la primera respuesta que ocurra después de un intervalo 
designado (fijado), que se mide a partir del reforzamiento precedente o desde el 
inicio de un **estímulo de ensayo””. Los intervalos típicos se extienden desde 30 
segundos a 10 minutos, aproximadamente. Este arreglo, llamado “*recondiciona- 
miento periódico'* o *'reforzamiento periódico” (ambas formas ya en desuso), 
virtualmente controla el número de reforzamientos entregados por hora al animal. 
Los programas de intervalo hijo (FF) producen resultados legítimos y ordenados. 
Uno de los primeros hallazgos de Skinner (1938) fue que sus ratas tendían a emitir 
un número casi constante de respuestas por reforzamiento (en un estudio, alrede- 
dor de 18 a 20 presiones de palanca). Así, la tasa promedio de respuesta, expresa- 
da como respuestas por minuto, sería aproximadamente dos veces más alta cuan- 
do el animal trabaja en un FF de 2 minutos (abreviado [F 2”) que cuando lo hace en 
uno de 4 minutos. Un segundo resultado fue lo que se denominó festón del IF, que 
se ilustra en el cuadro superior izquierdo de la figura 7.3. El festón del 7F se indica 
con una tasa cero de respuesta inmediatamente después de un reforzamiento, si- 


JPara otras interpretaciones del aprendizaje animal, consúltense a Breland y Breland (1951) y a Skin- 
ner (1951). Es dudoso que la mejor manera de construir una cadena de respuesta ABC consista 
siempre en proceder desde el reforzamiento hacia atrás, agregando nuevos elementos al extremo fron- 
tal como al entrenar €, después BC, y finalmente ABC, Enmuchas circunstancias es igualinente apro- 
piado construir una cadena hacia adelante, insertando un elemento nuevo entre la penúltima respuesta 
y el reforzamiento, como enla secuencia de entrenamiento A, entonces AB, entonces ABC para obte- 
ner reforzamiento. 
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gue entonces una aceleración gradual hasta una tasa elevada de respuesta próxima 
al momento en que un reforzamiento se vuelve disponible. El festón del 1F' se de- 
sarrolla de forma gradual con una exposición continuada a un 7F dado, y constituye 
una clara indicación de la discriminación del tiempo. Es decir, en un FF, un reforza- 
miento no está disponible inmediatamente después de otro, pero a medida que 
transcurre el tiempo *'subjetivo”” desde el reforzamiento previo, la respuesta del 
animal tendrá cada vez más probabilidades de ser reforzada. Con el entrenamiento 
continuo, la discriminación temporal se hace más definida, sin embargo, hay limita- 
ciones bastante claras de la exactitud con la que puede estimarse un intervalo tem- 
poral. Estos festones se eliminan mediante los programas de intervalo variable 
(1V). que se ilustran en el cuadro inferior izquierdo de la figura 7.3, en los cuales se 
utiliza aleatoriamente un rango de intervalos, desde uno muy breve hasta uno muy 
largo, en un arden variable. En el /V la ejecución promedio depende principalmen- 
te del intervalo promedio aritmético, que varía en proporción inversa. La pausa 
posreforzamiento tiende a eliminarse en el /V, en especial si se incluyen interva- 
los muy cortos en el conjunto. Con tales programas, la ejecución promedio es no- 
tablemente estable y uniforme. 

En la figura 7.4 se presenta una gráfica de tal estabilidad. Debido a la estabilidad 
y ala posibilidad de reproducción de la ejecución IV, ésta suele usarse como una 
línea base para la evaluación de los efectos conductuales de diversas variables que 
pueden introducirse en la situación (nivel de impulso, castigo, drogas, etc.). Las 
respuestas entrenadas en programas /V también muestran una resistencia poco 
usual a la extinción; por ejemplo, no es extraño observar que las palomas respon- 
den más de 10 000 veces durante la extinción, a continuación del entrenamiento. 
En términos generales, la resistencia a la extinción depende de los intervalos me- 
dio y máximo. 

La otra clase importante de programa de reforzamiento es la de razón fija (RF): 
en él el reforzamiento se proporciona después de un número predeterminado de 
respuestas, a continuación del reforzamiento precedente. El número predetermi- 
nado de respuestas está en el rango de 10 a 200, aunque pueden lograrse razones 
tan elevadas como 1 000 o más con las respuestas que requieren relativamente de 
poco esfuerzo. Por lo general, a un animal no se le coloca directamente en un 
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Figura 7.4. Respuestas bajo reforzamiento de intervalo variable, Las curvas corres- 
ponden a las respuestas de picoteo de una paloma reforzada a intervalos que va- 
riaban de 10 segundos a 21 minutos, pero que en promedio eran de 5 minutos. Cada 
una de las líneas inclinadas representa 1 000 respuestas, la pluma marcadora regresa al 
cero después de cada mil respuestas, El registro total contiene unas 20 000 respuestas 
producidas aproximadamente en 3 horas, con un promedio de 12 reforzamientos por 
hora. Cada rayita horizontal representa un reforzamiento (tomada de Skinner, 1950). 


programa de razón alta, sino que ayanza poco a poco desde los requisitos de razón 
más baja, para impedir la extinción temprana. 

Las respuestas en los programas de razón tienden a ser muy rápidos (en el len- 
guaje de laboratorio se denominan “trenes””), ya que cuanto más rápido conteste 
el animal, con mayor prontitud consigue la recompensa (0 más elevada será su ta- 
sa de reforzamiento por unidad de tiempo). Obsérvese la ilustración en el cuadro 
superior derecho de la figura 7.3, Al igual que en el festón de FF, la respuesta 
dentro de un segmento RF tiende a tener dos valores: una larga pausa posrefor- 
zamiento, seguida de un cambio abrupto a una tasa de respuesta muy alta, que se 
mantiene hasta que el requisito de razón se satisface y se obtiene el reforzamien- 
to. La pausa posreforzamiento es más prolongada, con razones más grandes, y la 
afectan muchas variables (emoción, nivel de impulso, drogas, etc.), mientras que 
la tasa de respuesta terminal parece relativamente fija e insensible a tales va- 
fiables. Skinner compara la pausa postreforzamiento con la *'abulia””, la incapaci- 
dad de gastar esfuerzo. Una analogía sería la del estudiante que termina una com- 
posición de examen trimestral, tal vez en un ““tren”” de velocidad a medida que se 
acerca la fecha de entrega, y le resulta difícil comenzar a trabajar en una nueva ta- 
rea. En la ejecución de razón fija, la retroalimentación producida por la respuesta, 
y que se acumula mediante el cómputo de la respuesta actual, se convierte en un 
predictor discriminativo de reforzamiento para el organismo. Varios experimentos 
(por ejemplo, Mechner, 1958) nos demuestran que los animales pueden usar su 
cómputo de respuestas en la palanca A como estimulo discriminativo para cambiar y 
presionar la palanca B, a fin de conseguir un reforzador que se hace disponible me- 
diante la terminación del cómputo en A. 

Como sucede con el intervalo fijo, la pausa posreforzamiento en RF se elimina 
al adoptar un programa de razón variable, en el cual la razón varía aleatoriamente 
de pequeña a grande, Como la probabilidad de reforzamiento para cualquier res- 
puesta es aproximadamente constante con independencia del cómputo, resulta 
una tasa uniforme de respuesta. Obsérvese la ejecución esquematizada en el 
cuadro inferior derecho de la figura 7.3. La tasa es generalmente alta debido a que 
los ““trenes'” rápidos de respuestas tienden a '“encontrar'” el reforzamiento más 
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rápido, y por eso se refuerzan de modo preferencial. Por ejemplo, en tales progra- 
mas una paloma puede responder con tanta rapidez como cinco picoteos por se- 
gundo, y mantener esta tasa durante horas. 

Las posibles variaciones en los programas de reforzamiento son casi ilimitadas. 
La recompensa puede programarse de acuerdo con el paso del tiempo, el número 
de respuestas o alguna combinación de ambos; los programas pueden disponerse 
en secuencias con indicios asociados o sin ellos, etcétera. En su obra Schedules of 
reinforcement (1957), Ferster y Skinner investigaron los efectos a largo plazo de 
aproximadamente veinte de esos programas. Es difícil resumir el formidable 
catálogo de datos sistemáticos que los citados investigadores reunieron, aunque la 
ejecución asintótica que generalmente mantiene un programa dado se comprende 
con facilidad en términos de los conceptos familiares de discriminación del 
estímulo y del reforzamiento que fortalece a la fqse momentánea específica de res- 
puesta (o tiempo interrespuesta) que preyalecía en el momento de entregar el re- 
forzamiento, 

Para ilustrar algunos casos de las ejecuciones inducidas por el programa, consi- 
dérense dos programas. RDB (reforzamiento diferencial de tasas bajas de res- 
puesta) y un programa ““tándem'”, donde a un requerimiento de intervalo figo sigue 
un requerimiento de razón fija para el reforzamiento (tándem IF-RF), Primero, en 
un programa RDB, por ejemplo de 10 segundos, una respuesta se reforzará sólo 
si han transcurrido al menos 10 segundos desde la última respuesta. Si la respues- 
ta se produce demasiado pronto, el cronómetro se pone nuevamente en marcha y de- 
be mediar otra espera de por lo menos 10 segundos antes de que una respuesta se re- 
compense. Los programas RDB generan conducta a tiempo; el animal usualmente 
aprende a pasar por una variedad de rítuales, que dan lugar a una respuesta alra- 
dedor del tiempo criterio. El análisis de la ejecución RDB, así como de otras eje- 
cuciones programadas (Morse, 1966; Shimp, 1969) trata al tiempo entre respues- 
tas sucesivas (tiempo entre respuestas o TER) como unidad de análisis, como lo 
hace Logan (1960) en su teoría micromolar. Es decir, se supone que la mayoría de 
los programas imponen un contrato o “función de términos”. que relaciona las di- 
ferentes probabilidades de reforzamiento para los distintos TER. En un programa 
RDB de 10 segundos, todos los TER menores de 10 segundos tienen una proba- 
bilidad cero de ser reforzados, en tanto que los TER mayores de 10 segundos po- 
seen una probabilidad de uno. Esta probabilidad de reforzamiento, junto con otros 
factores, afecta la fuerza” de cada TER, y supuestamente el animal escoge (a 
continuación de cada respuesta) qué TER será el próximo que emitirá. Sin entrar 
en más detalles, tales teorías esperan que los animales ajusten su selección del 
TER al programa RDB, ya que solamente se reforzarán los TER que exceden al 
tiempo criterio, 

Consideremos ahora la ejecución en un programa tándem [F-RF, Supóngase 
que el componente FF inicial es largo, por ejemplo de 6 minutos, después de lo 
cual la primera respuesta termina el componente /F y, sin ningún cambio de 
estímulo externo, comienza una razón fija; por ejemplo, una pequeña de 5 res- 
puestas, a cuya terminación se produce el reforzamiento, y el programa vuelve al 
componente grande /F. Ahora bien, en un programa simple [F 6', una paloma 
hambrienta podría promediar 100 respuestas por intervalo de 6 minutos (se esco- 
ge una cifra hipotética para ejemplificar). Pero cuando el pequeño RF 5 se agrega 
como un requerimiento al final, como lo hace el tándem IF 6' RF'5, la tasa de res- 


232 Primera parte. Teorias asociacionistas 


puesta no sube tan sólo a 105 por intervalo de 6 minutos, sino que se incrementa, 
casi tres veces, hasta aprowmadamente 300 respuestas por intervalo de 6 minu- 
tos. ¿Cómo podemos entender un efecto tan grande sobre la conducta de lo que 
parece ser un cambio trivial en los requisitos para el reforzamiento? De nueva 
cuenta, debemos prestar suma atención a las diferencias entre el IF 6" y los 
programas tándem IF 6” RF 5 en términos de la tasa momentánea de respuesta 
que tiene probabilidades de prevalecer en el momento del reforzamiento, Un 
programa ¿F simple refuerza diferencialmente los TER largos, ya que cuanto más 
esperamos después de su respuesta previa, más probabilidades habrá de que el in- 
tervalo se interrumpa. El pequeño requerimiento de razón fijado de forma insegu- 
ra en el final de los intervalos fijos altera las cosas: ahora el reforzamiento es más 
probable cuando ocurre un **tren”' o una corrida de respuestas rápidas, ya que és- 
tas cumplirán con el requerimiento RF 5. El resultado es que los *'trenes”” de 3 a 
B respuestas se fortalecen como una unidad. Así, en la porción IF 6* del programa 
tándem, el pájaro todavía muestra un festón IF (**a tiempo””), a excepción de que 
ahora, cuando responde lo hace en **trenes'' de picotazos. El resultado es, enton- 
ces, un gran aumento en la Lasa global de respuesta cuando se cuenta de acuerdo 
con los picotazos individuales. 

Éstos son algunos ejemplos de ejecuciones inducidas por el programa y se les 
puede analizar razonablemente en términos de reforzamiento de diferentes TER. 
Así como podemos observar la ejecución de una sola operante mantenida por un 
programa dado, también es posible examinar la elección preferencial entre dos 
programas, cada uno de ellos correlacionado con una llave distinta de respuesta. 
Mediante el uso de constructos de la fuerza de respuesta parecidos a los de Hull, 
Hermstein (1970) ha demostrado la manera en que la elección de porcentaje entre 
dos programas concurrentes de intervalo variable (cada uno asociado con dos lla- 
ves diferentes) termina por igualar las tasas relativas de reforzamiento para el pi- 
coteo en las dos llaves. 

Vale la pena anotar que la confiabilidad y la regularidad de la ejecución en los 
programas de largo plazo es sorprendente. La ejecución también es sumamente 
repetible; es decir, podemos cambiar temporalmente al animal a otros programas, 
pero cuando se le vuelve a colocar en el original, a la postre obtiene casi la misma 
ejecución estable (''asintótica””) que antes tenía. Debido a la ““recuperabilidad'” 
de la ejecución estable inducida por un programa dado, el procedimiento expe- 
rimental que favorecen los skinnerianos consiste en hacer pasar a cada tmo de 
varios animales por todas las condiciones experimentales repetidas veces, en secuen- 
cia de bloques (Sidman, 1960). De este modo, por ejemplo, se podría diagramar 
una función completa para cada sujeto, donde se relacionará la variable indepen- 
diente (es decir, el tamaño del requerimiento de razón fija) con una variable de- 
pendiente (la pausa promedio posreforzamiento en estado estable). El procedimiento 
es muy recomendable cuando tratamos más con estados estables que con fenóme- 
nos de adquisición (““transitorios”*). Sidman (1960) proporciona los argumentos 
más convincentes para aplicar esta estrategia de investigación en todos los estu- 
dios conductuales, y no sólo en los relacionados con programas. 

Otra técnica conductual muy difundida es lo que Ferster y Skinner (1957) deno- 
minan programas múltiples. Al organismo se le puede entrenar concurrentemente 
a responder de la manera apropiada a diversos programas distintos, cada uno de 
los cuales ocurra muchas veces durante una sesión experimental en alternación 
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aleatoria con los otros componentes de programa, y cada uno asociado con un 
estímulo discriminativo diferente, como luces de distintos colores proyectadas 
desde el fondo sobre la llave de picoteo. Skinner ha entrenado a una paloma hasta 
en nueve diversas ejecuciones (patrones de picoteo en las aves) controladas su- 
cesivamente durante la misma sesión por nueve estímulos distintos. Por ejemplo, 
en un programa múltiple de tres componentes, una paloma podía tener un 1F 1' 
cuando la llave era verde, un /F 2' si era blanca, y un ¿F 4” cuando era roja, y es- 
tos tres componentes en orden aleatorio durante cada 8 minutos. Como los anima- 
les tienden a comportarse discriminativamente y de modo apropiado a cada com- 
ponente del programa, de esta forma podemos trazar una relación funcional para 
cada individuo; es decir, relacionar las respuestas por reforzamiento con la longi- 
tud del /F. El procedimiento tiene muchos aspectos recomendables. El problema 
con el método, que se reconoce con claridad, es que los resultados deben in- 
terpretarse con precaución cuando hay interacciones claras entre los diversos 
programas que están controlando sucesivamente a la respuesta. Interacción signi- 
fica que la ejecución en el programa 4 depende del programa B, con el cual se al- 
terna dentro de una sesión experimental. Aunque tales interacciones constituyen 
por sí mismas un tema interesante (en los fenómenos del contraste conductual), 
ponen en tela de juicio la interpretación de las relaciones funcionales observadas 
con el uso de programas múltiples. 


Reforzamiento condicionado 
El principio del reforzamiento condicionado es el siguiente: 


Un estímulo que originalmente no es reforzante. .. puede hacerse reforzante mediante 
la asociación repetida con otro que sí lo es (Keller y Schoenfeld, 1950, pág. 232). 


Es decir, mediante el condicionamiento, un estímulo adquiere el poder de actuar 
como reforzador, lo cual a menudo se designa con expresiones reforzamiento se- 
eundario o recompensa adquirida. Considérese, por ejemplo, la adquisición del po- 
der reforzante de la luz en el experimento siguiente: cuando una rata presiona una 
barra, se enciende una luz; después de un segundo, una bolita de comida cae en un 
comedero, y ésta refuerza el presionamiento de la palanca. La luz permanece en- 
cendida durante 2 segundos después de la aparición de la comida. Diversos grupos 
de animales se condicionan de este modo, con 10, 20, 40, 80 y 120 reforzasnien- 
tos, respectivamente. Después del condicionamiento, la tasa de respuesta se ex- 
tingue hasta un bajo nivel al hacer que el presionar la palanca no encienda la luz ni 
proporcione comida. Entonces las contingencias se cambian, de modo que el opri- 
mir la palanca ahora enciende la luz durante un segundo, pero sin entregar alimen- 
to. En tales circunstancias las respuestas aparecen otra vez, lo cual demuestra 
que la luz adquirió propiedades reforzantes. El número de respuestas emitidas en 
un periodo de 45 minutos se incrementa con el número de pareamientos ante- 
riores de la luz y la comida (Bersh, 1951). 

Otros experimentos sugieren que la luz adquirirá propiedades reforzantes se- 
cundarias sólo si aparece entes del estimulo reforzante, y por esto es una parte de 
una cadena o un estímulo discriminativo para la respuesta consumatoria (Schoen- 
feld et al., 1950; Webb y Nolan, 1953). 
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El siguiente resumen de los puntos esenciales del reforzamiento condicionado 
pone de manifiesto su importancia sistemática en la conducta operante: 


1. Un estímulo que ocasiona un reforzamiento o lo acompaña adquiere de allí en adelan- 
te valor reforzante propio, y se le puede llamar reforzamiento secundario, condicionado o 
derivado. Un reforzamiento secundario puede extinguirse cuando se aplica reiteradas ve- 
ces a una respuesta para la cual no hay un reforzamiento primario último, 

2, Un reforzamiento secundario es positivo si el reforzamiento con el cual se correlaciona 
es positivo. y negativo cuando el segundo también loes. 

3. Una vez establecido, un reforzamiento secundario es independiente y no específico; 
no sólo fortalecerá a la misma respuesta que producía al reforzamiento original, sino que 
también condicionará una respuesta nueva y no relacionada. Además, producirá esos 
efectos incluso en presencia de un motivo distinto. 

4. Mediante la generalización, adernás del correlacionado con el reforzamiento, muchos 
estímulos adquieren valor reforzante, positivo o negativo (Keller y Schoenfeld, 1950, 
pág. 260). 


Una consecuencia importante del desarrollo del reforzamiento secundario es la 
aparición de una clase de reforzadores generalizados (Skinner, 1953, págs. 77-81). 
Esta generalización ocurre debido a que algunos reforzadores secundarios tienden 
a acompañar a una variedad de reforzadores primarios. El dinero constituye una 
ilustración apropiada, ya que proporciona acceso a la comida, a la bebida, a la pro- 
tección, a las diversiones, y se convierte así en un reforzador generalizado para 
una variedad de actividades. Las denominadas necesidades sociales (necesidad de 
atención, de afecto, de aprobación) conducen a los tipos de conducta persistente 
que se comprende mejor como consecuencia del reforzamiento intermitente, y los 
tipos de reforzamiento buscados son los generalizados implicados en las palabras 
atención, afecto y aprobación. La conducta lingííística, como llamar a los objetos 
por sus nombres correctos, tiende a ser reforzada por el reforzamiento generali- 
zado de los sujetos que escuchan, quienes muestran de formas indirectas si en- 
tienden y aprueban, o no. 

Según Skinner, los reforzadores generalizados a la postre son efectivos, aun 
cuando ya no los acompañen los reforzadores primarios sobre los que se basan 
(1953, pág. 81). 


OTRAS INFLUENCIAS QUE AFECTAN 
ALA FUERZA OPERANTE 


En su esfuerzo por ser descriptivo y positivista. Skinner ha intentado evitar la 
postulación de intermediarios no observados en sus experimentos, y en su lugar 
introduce un procedimiento que denomina análisis fencional, Este se refiere a la 
validez de las relaciones observables y a la manera en que las mismas se modifican 
en condiciones específicas. Acabamos de reseñar una clase muy importante de 
eventos en el análisis funcional de la conducta: los reforzamientos y la forma en 
que su programación afecta a la fuerza operante. El impulso, la emoción y el casti- 
go también son determinantes de la tasa de respuesta en los estudios de condiciona- 
miento; en las siguientes secciones veremos más ampliamente cómo maneja Skin- 
ner estos tipos de eventos. 
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Impulso 


Las horas de privación de comida son importantes para determinar la tasa de 
respuesta de un animal reforzado con alimento. La variable independiente que se 
traza es exactamente eso: las horas de privación. ¿Es necesario agregar algo 
más? ¿Es indispensable hablar de las necesidades fisiológicas o'del hambre? Antes 
de abordar la respuesta a esas interrogantes, citemos algunos resultados experi- 
mentales típicos. ; 

En un programa de intervalo fijo, ocho ratas aprendieron a presionar una palanca 
para obtener comida. Practicaban diariamente pero recibían la principal porción de 
sus raciones alimenticias en días alternados. La correlación entre las respuestas y 
las horas de privación se mostraban en tasas elevadas, en contraposición a bajas 
tasas en días sucesivos. Se crearon dos subgrupos y se igualaron de acuerdo con 
sus tasas de respuesta durante el condicionamiento. Entonces se les extinguió en 
días alternados: a un grupo cuarido su hambre era alta, y al otro cuando era baja. 
El grupo de hambre elevada producía casí el doble de las respuestas del grupo bajo 
en periodos de días sucesivos, aunque las dos curvas de extinción mostraban tra- 
yectorias similares (Skinner, 1950, págs. 201-202). 

¿Afecta la privación el efecto de fortalecimiento de cada reforzamiento, o sólo 
incide en la tasa de respuesta durante la extinción? En una prueba de estas rela- 
ciones, se entrenó a las ratas con reforzamiento después de varios periodos dis- 
tintos de privación de alimento, desde media hasta 47 horas. Varios subgrupos de 
animales recibieron entrenamiento de 1, 10 y 30 reforzamientos, respectivamen- 
te. Entonces, la fuerza del condicionamiento $e comprobaba mediante la resisten- 
cia a la extinción, en un nivel común de privación (23 horas), La resistencia a la ex- 
tinción se correlacionaba con el número de reforzamientos previos, pero no con el 
nivel de privación durante el entrenamiento (Strassburger, 1950), 

Estos estudios bastan para ilustrar los tipos de relaciones entre impulso y condi- 
cionamiento operante que se ofrecen a la investigación. En una descripción de los 
resultados por lo general dudamos entre describir a las ratas como “privadas de 
comida'” o como ''hambrientas””. Las dos expresiones son operacionalmente 
equivalentes, aunque cuando asignamos los resultados al “*hambre”" en lugar de 
adjudicarlos a las **horas sin alimento””, tendemos a implicar una teoría lo que nos 
remite de nuevo al problema del **impulso'* como concepto. 

Skinner es muy claro cuarido afirma que *“impulso”” es sólo un conjunto de ope- 
raciones (como el retener la comida durante un cierto número de horas o reducir 
el peso de un organismo hasta un determinado porcentaje de su peso ““normal'”) 
que tienen un efecto sobre la tasa de respuesta. Se interesa por la validez de estos 
efectos en varias circunstancias. Critica gran parte de los usos actuales en 
psicología del concepto “impulso” al argumentar lo siguiente (1953, págs. 144): 


Un impulso no es un estínulo. 

Un impulso no es un estado fisiológica. 

Un impulso no es un estado psíquico. 

Un impulso na es un simple estado de fuerza. 


Con estas negativas aclara que no acepta a los estímulos de las contracciones 
estomacales como prototipo de los impulsos y tampoco a las necesidades fisiológi- 
cas, a los placeres o dolores, deseos a apetencias. Para los propósitos del estudio 
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sistemático de la conducta, la palabra impuso se emplea sólo para reconocer cier- 
tas clases de operación que afectan a la conducta de modo distinto de como lo hace 
el reforzamiento. Skinner no cree que sea necesario inferir un intermediario (va- 
riable interviniente o constructo hipotético) para llevar a cabo el análisis funcional. 
Los principales argumentos contra este rechazo que Skinner hace del impulso se 
deben a N. E. Miller (1969), y la lógica de tales *"variables intervinientes” ya se 
examinó en el capítulo 5. Miller señala la parsimonia de postular una variable inter- 
viniente como la sed o el hambre cuando debemos resumir un elevado número de 
relaciones de entradas y salidas, y vincular una cantidad de operaciones indepen- 
dientes inducidas por la sed (2) con un número de conductas relacionadas con la 
sed (5). En principio. hay £ x b funciones de entrada y salida por determinar. La 
postulación de una variable interviniente de la sed puede reducir este número que 
requiere determinación a £ + b relaciones funcionales, lo cual demuestra la manera 
en que la sed (la variable interviniente está relacionada funcionalmente con las va- 
riables independientes ? y con las variables dependientes 5. Miller estableció me- 
dios para comprobar esta formulación, y se lamenta de que dispongamos de tan 
pocas pruebas del *“carácter unitario”” de la plétora de variables intervinientes que 
los psicólogos postulan. 


Emoción 


Así como los impulsos se clasifican impropiamente como estímulos, Skinner afir- 
ma que a menudo las emociones se consideran de modo erróneo como respues- 
tas. Llorar al recibir un golpe en la espinilla o por haber perdido en algún juego 
suele estimarse como una respuesta emocional, pero no se dice lo mismo de llorar 
por tener una basurilla en el ojo. Se rechaza esta forma de tratar la emoción y se 
prefiere considerarla como una relación entre una situación y una respuesta, lo 
cual coincide en muchos sentidos con el impulso. 

Un ejemplo de esta visión de la emoción se encuentra en el estudio de la supre- 
sión condicionada o la respuesta emocional condicionada (REC), un fenómeno que 
Estes y Skinner (1941) demostraron por primera vez. Se sabe que una descarga 
eléctrica dolorosa provoca una supresión o cesación de las conductas apetitivas 
como comer o beber o de las respuestas instrumentales reforzadas por tales con- 
secuencias. Estes y Skinner descubrieron que un estímulo anteriormente neutral 
que se parea repetidas veces con la descarga, puede entonces ejercer este mismo 
efecto de supresión sobre cualquier conducta apetitiva en marcha. En un experi- 
mento típico se usa una rata hambrienta entrenada para presionar una palanca y 
obtener reforzamiento alimenticio en un programa de intervalo variable que gene- 
ra una tasa muy estable de respuesta. Entonces se proporciona una serie de ensa- 
yos de condicionamiento pavloviano, durante los cuales se oye un sonido durante 5 
minutos, que termina con la descarga eléctrica. Más tarde, después de que el ani- 
mal ha regresado a una presión estable de palanca en el programa [V, el sonido se 
oye, por ejemplo, durante periodos de 5 minutos, en los cuales el animal a menudo 

e “congela”, reduce su tasa de opresión, se agazapa y muestra signos de una 
respuesta emocional condicionada. Objetivamente, el sonido ha suprimido la opre- 
sión de palanca. Una vez que el evento de sonido-descarga ha concluido, la rata 
reanuda muy pronto la opresión de la palanca. Estos periodos de tono y de no-tono 
pueden alternarse repetidas veces durante la sesión experimental. A la postre el 
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animal oprime la palanca a una tasa más alta que cuando el sonido no se oye, y rela- 
tivamente poco cuando el sonido sí se oye. El grado de supresión se informa gene- 
ralmente en términos de una '“supresión””, como la disminución en la tasa de res- 
puesta causada por el tono, dividida por la tasa de línea base del no-sonido. Este 
índice varia desde O hasta 1, a medida que la supresión controlada por el sonido de 
la tasa de respuesta varía desde nada hasta la supresión total. 

La mayoría de los psicólogos interpretan el resultado como debido a la compe- 
tencia motivacional entre la ansiedad condicionada y los motivos de apetito (Estes, 
19695; Stein, 1964). Además, el condicionamiento de la ansiedad por el parea- 
miento de sonido-descarga se concibe como un paradigma pavloviano a de condi- 
cionamiento clásico. Por consiguiente, la razón de supresión proporciona una téc- 
nica apropiada para el estudio del condicionamiento clásico, y se ha usado mucho 
con ese fin (Kamin, 1965; 1969a; Rescorla, 19690), De hecho, para muchos pro- 
pósitos, la razón de supresión puede considerarse corno si se tratara de “gotas de 
saliva'” en el condicionamiento de la salivación. 

La supresión condicionada constituye sólo un ejemplo de la **emoción””, y no es 
necesario aclarar que hay varios otros. Una reacción emocional muy estudiada 
(por ejemplo, Ulrichy Azrin, 1962) es la agresión reflexiva, o las peleas de animales 
provocadas por el dolor causado por una descarga eléctrica o un galpe físico (Azrin 
et al., 1965), o incluso por la frustración resultante del no reforzamiento de una 
respuesta que antes recibía reforzamiento positivo (Azrin ef al., 1966). Al parecer 
ésta es una respuesta muy extendida, que se encuentra en muchas especies; la 
agresión no está dirigida discriminativamente, sino que apunta a cualquier objetivo 
asequible, incluyendo a ''inocentes espectadores””. 


Castigo 


En los procedimientos de castigo, un evento aversivo se hace contingente de 
una respuesta que típicamente tiene alguna fuente previa de fuerza. Skinner ob- 
servaba que la disposición de la contingencias en el castigo es lo contrario del re- 
forzamiento (aunque los efectos no son opuestos). Distinguía dos tipos de castigo: 
la presentación de un estímulo aversivo o desagradable, como una descarga 
eléctrica; y la eliminación de un reforzador positivo. La segunda forma del castigo 
es común en las modalidades de multas, detención o proscripción en las cuales, el 
sujeto pierde algo de valor o se le retira un privilegio. 

Las opiniones de Skinner en torno al castigo han sido revisadas en el transcurso 
de los años. En algunos de sus estudios iniciales (Skiner, 1938, pág. 154) utilizaba 
un castigo leve (la palanca le daba un palmetazo a la pata de la rata cuando ésta la 
presionaba), y concluyó que el castigo era un medio un tanto ineficaz para producir 
algún cambio permanente en la conducta. Se afirmaba que el castigo tenía un efec- 
to supresivo sobre la conducta mientras permanecía en aplicación, pero cuando se 
eliminaba, se “recuperaba?” la respuesta anterior, que se emitía casi tanto como 
durante la extinción de una respuesta no castigada. Esta interpretación de que el 
castigo es relativamente ineficaz para alterar la conducta se ha mencionado mucho 
y se ha esgrimido en varios argumentos de carácter más liberal relacionados con 
aplicaciones prácticas de modificación de la conducta. 

La prescripción consistía en emplear sólo el reforzamiento positivo, ya que los 
castigos eran ineficaces y sólo tenían nocivos efectos secundarios. Pero vista 
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retrospectivamente la interpretación es algo extraña. Con esta lógica, podríamos 
afirmar que el reforzamiento positivo es ineficaz, *“sólo temporal sin efectos dura- 
deros”*, porque la respuesta se extingue cuando se retira el reforzamiento. Otros es- 
tudios y análisis del castigo dirigidos por Azrin y Holz (1966) muestran lo eficaz que 
el mismo puede ser para suprimir la conducta apetitiva, cómo varía de manera váli- 
da can los parámetros del castigo y cómo se recupera la conducta después de que 
se elimina el castigo y continúa el reforzamiento. Ázrin y Holz resumieron sus nu- 
merosas investigaciones en los siguientes términos: 


Se hará una breve síntesis de algunas de las circunstancias que se ha descubierto elevan 
al máximo su efectividad: 1. El estímulo de castigo deberá disponerse de tal modo que no 
sea posible ningún escape no autorizado, 2. El estimulo de castigo habrá de ser tan intenso 
como sea posible, 3. La frecuencia del castigo tiene que ser tan elevada como sea factible, 
4. El estímulo de castigo deberá suministrarse inmediatamente después de la respues- 
ta, 5. El estímulo de castigo no se incrementará gradualmente, sino que se introducirá 
a su intensidad máxima, 6. Deben evitarse los periodos largos de castigo, en especial 
en lo que se refiere a las intensidades bajas de castigo, ya que el efecto de recuperación 
puede ocurrir por allí, Cuando se usen intensidades suaves de castigo, es mejor em- 
plearlas sólo durante un breve lapso, 7. Debe tenerse mucho cuidado de verificar que 
el suministro del estímulo de castigo no esté asociado diferencialmente con la entrega del 
reforzamiento. De otro modo, el estímulo de castigo puede adquirir propiedades refor- 
zantes condicionadas, 8. La entrega del estímulo de castigo debe convertirse en una se- 
ñal o estímulo discriminativo de que un periodo de extinción está en marcha, 9. El grado 
de motivación para emitir la respuesta castigada debe disminairse, 10. La frecuencia del 
reforzamiento positivo para la respuesta castigada se reducirá de modo similar, 11. De- 
berá estar disponible wa respuesta alternativa, y producirá el mismo reforzamiento o 
uno mayor que la respuesta castigada. Por ejemplo, cabe esperar que el castigo del com- 
portamiento delictivo sea más efectivo si la conducta 110 delictiva que da lugar a las mis- 
mas ventajas, está disponible, 12, Si no hay ninguna respuesta alternativa disponible, el 
sujeto debe tener acceso a una situación diferente en la cual obtenga el mismo reforza- 
miento sin ser castigado, 13. Si no es posible suministrar el estímulo mismo de castigo 
después de una respuesta, todavía existe un método efectivo de castigo. Un estímulo 
condicionado puede estar asociado con el estímulo aversivo, y aquél puede proporcionarse 
a continuación de una respuesta a fin de lograr el castigo condicionado, 14. Una reducción 
del reforzamiento positivo puede utilizarse como castigo cuando por razones prácticas, 
legales o morales, no es posible usar el castigo físico. En tales situaciones, el castigo 
por eliminación del reforzamiento positivo puede lograrse al disponer un periodo de 
frecuencia reducida de reforzamiento (tiempo fuera), a al arreglar una disminución del re- 
forzamiento condicionado (costo de respuesta). Ambos métodos requieren que el sujeto 
tenga un nivel elevado de reforzamiento para comenzar; de otra forma, ninguna elimina- 
ción del reforzamiento es posible. Siha de emplearse el castigo no físico, es conveniente 
proporcionar al sujeto una historia sustancial de reforzamiento, a fin de darle la oportuni- 
dad para la retirada del reforzamiento como castigo por las respuestas indeseables 
(1966, págs. 426-427). 


Como consecuencia de muchos estudios, los skinnerianos (Azrin y Holz, 1966; 
Dinsmoor, 1954, 1955) terrmnaron por interpretar los efectos del castigo en tér- 
minos similares a los de Mowrer y Miller, que hemos visto en el capítulo 5, Se 
presupone que el estímulo aversivo de castigo convierte la retroalimentación pro- 
pioceptiva de la respuesta castigada en un ““estímulo aversivo condicionado”, de 
modo que cuando la respuesta comience a ocurrir, la retroalimentación de los mo- 
vimientos incipientes es aversiva y, por lo tanto, se interrumpe la respuesta, Este 
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punto de vista ha originado cierto desencanto (véase Herrmstein, 1969; Schoen- 
feld, 1970), pero no nos detendremos a analizar esos desarrollos. 


TÉCNICA DE LABORATORIO 


La fuente de principios sustantivos en un área de conocimiento cientifico puede 
convertirse en un método o técnica para otra. Así, el transistor interesa al físico por 
lo que implica acerca de la física del estado sólido; pero es una bendición tecno- 
lógica para quienes se dedican a construir audífonos o radios de bolsillo. De modo 
similar, el condicionamiento operante resulta muy útil como metodología con- 
fable para el contro) de la conducta. Asociado con los métodos del condiciona- 
miento operante, existe un conjunto de diseños experimentales que recalcan el 
análisis conductual de los sujetos individuales. 


Diseños de investigación de un solo sujeto 


El diseño de investigación tradicional destaca la comparación de un grupo de su- 
jetos que recibe tratamiento experimental con un grupo control que no recibe nin- 
guno. La variabilidad de un efecto de tratamiento a través de los sujetos es lo que 
motiva el usual interés por las estadísticas de muestreo y las pruebas de significa- 
ción de una hipótesis de nulidad. El objetivo consiste en probar que, en promedio, 
los sujetos tratados muestran una ejecución distinta de los del grupo control. Skin- 
ner y sus seguidores le han restado importancia a las estadísticas de grupo y más 
bien abocan a controlar la conducta de organismos individuales a medida que pasan 
por ciclos en los diversos tratamientos experimentales. Los condicionadores ope- 
rantes desarrollaron tres diferentes diseños de investigación que pueden utilizarse 
para estudiar la efectividad de los tratamientos con un solo sujeto: el diseño de re- 
versión, líneas base múltiples y programas múltiples. 


Diseño de reversión 

Consiste en evaluar una condición de aprendizaje o reforzamiento al aplicarla du- 
rante un tiempo para observar cómo cambia la conducta contingente por encima 
de la tasa de línea base, y eliminar entonces la condición de reforzamiento para ver 
si la conducta retorna (*'se revierte””) a la línea base. El método se esquematiza 
en la parte Superior de la figura 7.5, con el ejemplo de un niño problema en la es- 
cuela primaria, que raras veces hace los ejercicios de matemáticas en su cuaderno 
cuando se le ordena. Durante el registro inicial de línea base, el niño termina al- 
rededor de dos problemas breves de adición en una sesión de matemáticas de 30 
minutos. Ásf, se instituye un sistema de puntos, en e) cual el niño recibe un punto 
por cada problema resuelto. y la oportunidad de convertir esos puntos en recom- 
pensas tangibles equivalentes (por ejemplo, caramelos) al final de cada lección. El 
programa de recompensa incrementa la tasa de solución de problemas durante va- 
nos días. Entonces, en la fase de reversión se eliminan el sistema de puntos y los 
reforzadores de apoyo, y no se sustituyen por ningún otro reforzador para cada 
problema de matemáticas. Esto da lugar a una rápida disminución en el número de 
problemas solucionados por día, para regresar casi a la línea base original. 
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En este caso, por razones prácticas el maestro debería reinstalar el sistema de 
reforzamiento para el trabajo de matemáticas, a in de retornar a una tasa alta. La 
lógica del diseño es que mediante la reversión podemos tener cierta seguridad de 
que nuestro tratamiento fue responsable (causal) del cambio conductual, en vez 
de que éste fuera ocasionado por factores extraños, como el paso del tiempo. El pa- 
radigma es poner en marcha el tratamiento, lograr la conducta; retirar el trata- 
miento, la conducta desaparece. El diseño de reversión no siempre es adecuado 
(por ejemplo, un médico clínico no revertiría un síntoma neurótico eliminado me- 
diante algún tratamiento conductual), pero constituye una herramienta sencilla y 
poderosa cuando resulta apropiada y si la conducta del individuo es lo bastante 
confiable. 


Línea base múltiple 

Otra forma de descartar influencias extrañas al evaluar la efectividad de algún 
tratamiento de reforzamiento consiste en registrar varias conductas diferentes 
(líneas base) de un solo sujeto, e introducir las contingencias de reforzamiento una 
por una y por separado en distintos momentos para cada conducta de línea base. 
El procedimiento general se esquematiza al comparar los dos cuadros de la figura 
7.5. Supóngase que durante la sesión de matemáticas este niño problema también 
Pasa mucho tiempo fuera de su lugar, camina por el salón de clases, se sienta en 
los pupitres de sus compañeros, etcétera. Supóngase también que el maestro 
quiere que el niño trabaje en su propio escritorio y que no distraiga a los demás 
alumnos. Decide medir el tiempo que el niño permanece en su pupitre durante la 
lección de maternáticas de 30 minutos. Tales periodos se encuentran en un rango 
bajo durante las primeras dos fases del experimento, y siguen igual cuando el re- 
forzamiento se instituye por terminar problemas de matemáticas. El hecho de que 
en la segunda fase la conducta reforzada (parte superior) se incremente mientras 
la otra conducta (parte inferior) no aumente, indica que el reforzamiento resulta 
efectivo y que su influencia es específica para la conducta que la produce. Significa 
también que las dos mediciones de respuesta son relativamente independientes, 
en el sentido de que una conducta cambia su tasa en tanto que la otra no muestra 
ningún efecto. En la tercera fase representada en la figura 7.5 (cuadro inferior) se 


Cap. ?. El condicionamiento operante de Skinner 241 


observa lv que sucede cuando el reforzamiento socia! (atención y elogio por parte 
del maestro) se hace contingente para que el niño se siente en su pupitre y traba- 
je, El permanecer sentado durante más tiempo, indica que el reforzador social es 
eficaz para esa conducta. Los diseños de línea base múltiple como éste pueden uti- 
hzarse con tantas conductas como el experimentador desee registrar y rastrear, 
Si la conducta a cambiar es indeseable, entonces resulta ventajoso el uso de un di- 
seño de línea base múltiple, ya que permite hacer inferencias causales (acerca de 
los efectos del tratamiento), incluso sin la reversión del cambio conductual. 


Programas múltiples 

Como hemos dicho, un programa múltiple se refiere a las circunstancias en que 
ocurren vatjos estímulos distintos dentro de una sesión experimental, cada uno de 
ellos asociado con una diversa condición de reforzamiento. Por ejemplo, los 
programas de reforzamiento diferentes podrían estar vigentes cuando la liave en 
una caja de palomas se ilumina en orden aleatorio con luces rojas, amarillas o ver- 
des, cada componente durante 5 minutos. Como el animal responde a cada compo- 
nente de acuerdo con su programa, el arreglo permite que el experimentador tra- 
ce una función paramétrica completa para cada sujeto. Así, durante una sesión 
(asintótica) el experimentador sería capaz de trazar una tasa de estado estable de 
respuesta a un estímulo como una función de, por ejemplo, la tasa de reforzamien- 
to en ese estímulo, o su tasa relativa a la tasa de reforzamiento promedio general. 
Ási, con un solo sujeto en una sesión puede obtenerse una función conductual 
completa. 


Procedimientos de la observación de campo 


Debido a su frecuente interés en la aplicación de los principios del aprendizaje a 
las metas prácticas en las situaciones de campo, los psicólogos skinnerianos han 
desarrollado un confiable conjunto de técnicas para la observación y el registro de 
conductas problemáticas por modificar. Los psicólogos a menudo tratan con niños 
y adultos con problemas de ajuste en situaciones laborales, interacciones fami- 
liares, salones de clases, guarderías infantiles, o enlas salas de los hospitales para 
enfermos mentales, Estos profesionales tienen la necesidad de crear un método 
para medir discretamente la tasa de ocurrencia de cierta conducta relevante en 
esa situación y diseñar entonces un programa para modificar esa conducta hacia me- 
tas más deseables, sin desorganizar totalmente el ambiente, Estos procedimientos 
de evaluación de la conducta se verán en el capítulo 9, en ocasión de examinar las 
aplicaciones de las ideas de la modificación de la conducta. Sin lugar a dudas, ésta 
es una de las contribuciones más concretas y valiosas de Skinner y sus seguidores 
ala psicología aplicada, 


Usos de la respuesta de línea base estable 


La repetibilidad y estabilidad de los datos de la ejecución se cuentan entre las 
características más atractivas del enfoque de Skinner del análisis experimental. El 
analista conductual generalmente controla circunstancias en las que pueden obser- 
varse muchos miles de respuestas y donde las tasas promedio de respuesta se ha- 
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cen muy estables y susceptibles de reproducción. Asinismo, al sujeto se le puede 
cambiar repetidas veces múltiples condiciones de reforzamiento y usualmente recupe- 
ra los mismos niveles de ejecución al retornar a la misma condición de reforzamiento. 
La regularidad y estabilidad de la conducta de estado estable de los organismos in- 
dividuales atestigua el perfeccionamiento de los controles experimentales, la 
constancia de la motivación y el poder de control de las contingencias de reforza- 
miento. Por supuesto, esos datos regulares tan envidiables se recaban en estado 
estable, por lo común después de que el animal ha tenido muchas horas (o miles de 
ensayos) de entrenamiento para ajustarse a cada condición de reforzamiento. Por 
el contrario otros psicólogos se interesan en el aprendizaje, en el proceso que ge- 
nera un cambio o transición desde una tasa de respuesta inicial a una terminal. y 
esta transición frecuentemente ocurre con rapidez. Además, quizá nunca sea 
exactamente repetible, ya que los hábitos del animal se transferirán para ayudarlo 
en caso de que se le haga aprender la misma tarea. Sin embargo, para muchas 
cuestiones prácticas el interés puede centrarse en la manera en que un tratamien- 
to afecta la ejecución asintótica (o motivación), no al aprendizaje transitorio, moti- 
vo por el cual se usan mucho los métodos de operante libre. 

Una aplicación que interesa al psicólogo experimental es la de la psicofísica ant- 
mal. Mediante métodos operantes es posible producir curvas de sensibilidad vi- 
sual para las palomas, que muestran el curso de adaptación a la oscuridad con toda 
la precisión de la experimentación con sujetos humanos entrenados (Blough, 
1961). Puede investigarse una serie de fenómenos perceptuales con animales, 
incluyendo las ilusiones visuales, los efectos del nivel de adaptación, la constancia 
del tamaño, etc. (Blough, 1966). 

Otra aplicación muy difundida es en el campo de las pruebas con drogas. Como 
las tasas de respuesta que se registran en la situación estándar de condicionamien- 
to operante son muy sensibles a la infuencia de tales sustancias, estos métodos 
son útiles para calibrar experimentos en farmacología. Así, por ejemplo, la mayor 
parte de las drogas y medicamentos nuevos que hoy en día recibimos ya han sido 
examinados mediante extensivas pruebas con animales (generalmente en tareas de 
condicionamiento operante», a fin de verificar efectos secundarios indeseables 
sobre la conducta. Las técnicas del control conductual también son muy populares 
entre los psicólogos fisiológicos, y por medio de ellas evalúan los efectos de refor- 
zamiento o motivación de la estimulación eléctrica o química del cerebro, las alte- 
raciones conductuales (por ejemplo, comer en exceso) causados por lesiones neu 
rológicas (como lesiones hipotalámicas), etcétera. 

Muchos científicos que comprueban teorías que se apartan considerablemente 
de las de Skinner reconocen la gran aplicabilidad de las técnicas asociadas con el 
control del estímulo y las contingencias de reforzamiento. Así gran parte del traba- 
jo actual en el aprendizaje y la motivación animal aplica la técnica skinneriana. Un 
volumen editado por Honig (1966) muestra las numerosas aplicaciones del méto- 
do en el estudio de diversos temas psicológicos y fisiológicos, Puede decirse que 
entre los estudiosos estadounidenses del comportamiento animal, la caja de Skin- 
ner ha desplazado al laberinto. 


Instrucción programada 


En 1954 Skinner se enfrascó en una serie de investigaciones e invenciones di- 
señadas para aumentar la eficiencia de la enseñanza de la artimética, la lectura, la 
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ortografía y otros temas escolares, mediante el uso de un dispositivo mecánico 
que hacía ciertas cosas mucho mejor que el maestro usual, mientras que le dejaba 
a éste las tareas en las que podía desempeñarse con mayor eficacia. Una primera 
forma del dispositivo presentaba numerosas combinaciones para la enseñanza de 
la adición. El niño marcaba su respuesta en el teclado de una especie de máquina 
de sumar; si la respuesta era correcta, el reforzamiento correspondiente se seña- 
laba por el hecho de que la máquina pasaba al problerna siguiente. Esto es fun- 
cionalmente lo mismo que sucede cuando a continuación de la respuesta del estu- 
diante, el profesor la califica con un correcto. Skinner ya había señalado que ningún 
maestro puede ser un reforzador tan discriminativo y de tan rápida regpuesta co- 
mo la máquina, pues no le es posible estar con todos los niños de la clase a la vez, 
estimulando sus respuestas apropiadas y corrigiendo las erróneas. Además, pro- 
bablemente el maestro no esté capacitado para establecer el orden y la tasa de 
presentación adecuada de los problemas, como se han determinado en los estu- 
dios empíricos del material de estudio. 

Los dispositivos de Skinner y otros basados en ellos se calificaron muy pronto 
como máquinas de enseñanza o dispositivos de autoinstrucción, y los materiales 
que se convirtieron en la base para la instrucción se denominaron programas. Al- 
gunos comenzaron a aparecer como libros programados (por ejemplo, Holland y 
Skinner, 1961). 

Un importante sumario de los artículos de Skinner aparecido en 1958 catalizó el 
interés acomulado, y la instrucción programada se convirtió en una gran empresa 
educativa y comercial que florece aún hoy en día. (El aprendizaje programado se 
verá en detalle en el capítulo 15). Los temas educativos esenciales para Skinner 
eran los siguientes: 


1. Obtener una especificación clara, detallada y objetiva de lo que significa “*cono- 
cer'” el tema de estudio; para el autor, esto consiste en una lista detallada de 
conexiones de estímulo y respuesta formuladas en terminos de preguntas y 
respuestas, o temas y comentarios. 

2. Escribir una serie de cuadros de estímulo (pregunta) — respuesta (contesta- 
ción) que expongan el material en pasos graduados de dificultad creciente, y 
que con frecuencia comprueben el mismo dato desde muchos ángulos distintos. 

3. Es necesario que el estudiante esté activo: por ejemplo, se requiere que elabo- 
re una respuesta para cada cuadro del programa. 

4. Proporcionar retroalimentación inmediata para cada respuesta (contestación). 

5. Tratar de disponer las preguntas de tal modo que la respuesta correcta tenga 
grandes probabilidades de ocurrir y de ser reforzada; así, se evitan los errores 
y el aprendizaje no va compañado de fracasos frustrantes o punitivos. 

6. Permitir que cada estudiante avance en el programa de enseñanza a su propio 
ritmo, 

7. Proporcionar diversos reforzadores de apoyo (elogio. méritos, fichas) para el 
trabajo diligente y efectivo. 


Aunque Skinner creía que la razón fundamental de estas proposiciones derivaba 
de los principios del condicionamiento operante, sus interpretaciones teóricas 
fueron motivo de ciertas polémicas. Cualquiera que sea el veredicto en lo que res- 
pecta a la esencia de la instrucción programada, no hay duda de que el resurgi- 
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miento del interés desde la década de los cincuenta se debió a Skinner, y tampoco 
hay duda de que desarrolló sus métodos a partir de un esfuerzo por generalizar a 
la educación lo que había aprendido en el laboratorio a través del estudio del condi- 
cionamiento operante. 


El entrenamiento del retrasado mental 


Los psicólogos avezados en las técnicas skinnerianas también figuran a la van- 
guardia del trabajo en la educación de los retrasados mentales (leves y severos) y 
de Jas personas incapacitadas. El hecho de adjudicar los problemas de una persona 
retrasada a un **desequilibrio neurológico'” no ayuda a remediar su situación. La 
orientación skinneriana se centra en deficiencias conductuales específicas, pre- 
gunta por las cadenas específicas de respuesta que han de ser entrenadas (por 
ejemplo, vestirse), en qué unidades menores es posible descomponerias, y cómo 
pueden entrenarse por separado esas pequeñas partes de conducta. 

Así, a un niño retrasado se le pueden enseñar los rudimentos de la computación 
al hacer que: 


a) Preste atención al maestro y trabaje en la tarea, 

b) Señale objetos simples que se muestran en una pantalla. 

€) Paree dos conjuntos de objetos para verificar si tienen el mismo número. 

d) Nombre los números con los dedos (hay rótulos con el número en cada dedo, 
de izquierda a derecha). 

€) Paree los dedos con objetos en un conjunto a contar, que también se contará en 
voz alta. 

» Paree números sucesivos (proporcionados en bloques) con objetos a contar. 

£) Contar en voz alta, y después en silencio, a medida que parea números con ob- 
jetos. 


El lector se sorprenderá de los numerosos pasos que pueden incluirse en un 
plan de entrenamiento, pero a menudo se requieren muchos para descomponer la 
habilidad que habrá de aprenderse, y es necesario apoyarse en sostenes parciales. 
Mediante esa programación de habilidades, a las personas incapacitadas se les 
entrena para que ejecuten tareas simples, e incluso complejas, que antes parecían 
imposibles de realizar (véanse las reseñas de Birnbrauer, 1976; y de Lovaas y New- 
som, 1976), En el entrenamiento de niños retrasados o psicóticos preocupa mu- 
cho su escasa habilidad lingííística, que frecuentemente es nula. Por lo tanto, 
muchos programas educativos se emprenden exclusivamente para enseñarles al 
menos los rudimentos del lenguaje receptivo (escuchar) y productivo (hablar). 


Canducta verbal 


El lenguaje es lo que distingue con mayor claridad a la conducta humana de la de 
los demás mamíferos. El conocimiento acerca de la forma en que adquirimos el 
lenguaje y la manera en que lo usamos es esencial para entender el aprendizaje hu- 
mano. Skinner ha manifestado gran interés por la conducta verbal. En 1936 grabó 
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un disco que contenía agrupaciones fortuitas de sonidos del habla, los cuales, por 
ser aleatorios, carecían de significado. El disco, llamado ““sumador verbal””, se 
utilizaba para estudiar las palabras que el sujeto que escuchaba * leía dentro'* de 
los sonidos. Se trata de un tipo de técnica proyectiva, similar a las manchas de tin- 
ta usadas en el campo visual (Skinner, 1936). En pocos años Skinner informó de 
estudios de asociación de palabras, aliteración y otros tipos de patrones de sonido 
(Skinner, 1937b; Cook y Skinner, 1939). Sus conferencias acerca de Willlam Ja- 
mes, dictadas en la Universidad de Harvard en 1948, aparecieron en una versión 
revisada que se titula Verbal behavior (1957), texto en el cual enfoca a la conducta 
verbal como un problema empírico. 

El punto central del análisis es que Jos sonidos del habla se emiten (y se refuer- 
zan) como cualquier otro sector de Ja conducta. Algunas de las articulaciones del 
habla exigen algo de quien las escucha y son reforzadas cuando esta persona acce- 
de. La articulación de un niño ' leche, por favar”” se refuerza cuando el padre obe- 
dece y le proporciona la Jeche. Esta función (denominada de mando) aparece 
muy pronto en la conducta lingúística del niño. Una segunda función se refiere en 
gran parte a la asignación de nombre a los estímulos discriminativos (la función de 
tacto). En el “juego de palabra original”, que el niño juega constantemente con 
sus padres y con otras persohas en su comunidad verbal surge un repertorio de 
nombres: “¿qué es eso?””; “es un automóvil”. **¿Es esto un automóvil?””; “no, 
es un camión ””, y así sucesivamente, Como los objetos y los sucesos son mul- 
tifacéticos, la adquisición de tacto generalmente requiere de la discriminación, 
donde el mismo tacto se refuerza para la característica relevante, a pesar de la va- 
riación en las características irrelevantes. Así, el tacto rojo termina por ser 
controlado por el color de las manzanas rojas, los automóviles rojos, los vestidos 
rojos, etcétra. Esta es en verdad una forma elíptica de hablar. la expresión “rojo” 
está de hecho controlada por un complejo de estímulos, incluyendo el objeto (o 
nuestro '*recuerdo”” del mismo), y una demanda de nombrar su calor en vez de alu- 
dir a su forma o sabor agradables, etcétera. La abstracción o generalización signi- 
fica que un tacto se ha puesto bajo el control de una sola propiedad de una clase de 
objetos complejos. Así, el concepto de objeto afilado puede aprenderse mediante 
la experiencia con hojas de rasurar, cuchillos y objetos similares. Además, la ad- 
quisición de una nueva regla como “Los objetos afilados pueden cortarte; debes 
evitarlos”, mediará cambios inmediatos en las respuestas a un rango de estímulos 
que provocan la misma denominación. Aquellas respuestas de evitación aparece- 
rán frente a nuevos patrones de estímulo (por ejemplo, vidrios rotos, sables) que 
la comunidad califica de “filosos””. 

Un tercer concepto introducido por Skinner es el de la conducta autociótica —su 
denominación para la conducta verbal—, que consiste en un comentario o descrip- 
ción, que hacemos nosotros mismos, de otra conducta verbal (1957, pág. 315). Por lo 
común, la persona que habla se refiere en parte, a su propio papel cuando emite 
conducta autoclítica. '“Yo estaba a punto de decir...'”, “yo no creo que...*”, 
“dudaría en considerarlo un embustero... .”*, “Juan xo lo hizo. ..*”, son ejemplos 
de canducta autoctítica. Así, las autoclíicas pueden comentar otras respuestas 
verbales a las que acompañan, especificar la fuerza de esa conducta, o identificar 
el efecto súbre la persona que habla acerca del hecho estipulado (como en **yo es- 
taba encantado de ...””, **felizmente, él... .””). o negar la verdad de una asevera- 
ción, 
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El ordenamiento de palabras es otra gran clase de fenómenos autoclíticos, Tra- 
dicionalmente denominados reglas gramaticales, usan lo que Skinner llama con- 
textos autoclíticos parcialmente condicionados (1957, pág. 336). A continuación 
del aprendizaje de tales contextos de posesión, como **el perro de la señorita”, 
*““el automóvil de la señorita”", y **el automóvil del hombre'”. la primera aparición 
de perro con hombre puede tactuarse como *“el perro del hombre”, al tactuar los 
objetos y su relación utilizando el contexto posesivo. Se propone que marcos simi- 
lares de posición de palabras son aplicables al ordenamiento de relaciones tac- 
tuadas de adjetivo-sustantivo y relaciones de actor-acción. Estas son, por supues- 
to, las bases de la predicación, que es una función primaria del lenguaje. Braine 
(1963) y Staats (1968) desarrollan esta opinión de que la información acerca de la 
estructura sintáctica se refiere fundamentalmente a las propiedades gramaticales 
de localizaciones dentro de contextos de oraciones (por ejemplo, la primera posi- 
ción en una oración aseverativa es a menudo un determinante, la segunda un sus- 
tantivo, etc.). Así, la relación sintáctica entre palabras proporcionada por un orde- 
namiento nuevo (“el gato de la señorita'” versus “la señorita del gato'') controla la 
interpretación correcta debido a la generalización contextual de la función de las pa- 
labras que llenan ciertas aberturas en el marco. Esto da lugar a cierto grado de 
productividad generativa en el sentido de que permite al niño entender nuevas 
combinaciones y ordenamientos de palabras. Braine (1963) informa de varios ex- 
perimentos positivos con niños, y Staats (1968) señala otros. Premack (1969) y 
Gardner y Gardner (1971) han utilizado estos principios para construir un conside- 
rable repertorio lingúístico de signos manuales en los chimpancés, que operan co- 
mo señales de comunicación con sus entrenadores. 

Sin embargo, el libro de Skinner Verbal behavior no ha ejercido gran influencia 
en la mayor parte de los análisis del lenguaje humano. Esto puede obedecer a que 
no fue muy bien recibido por los lingúistas (Chomsky, 1959, le dirigió una crítica 
connotada e implacable), Debido en gran medida a los análisis lingúísticos de este 
último, los modernos estudios de la gramática y del lenguaje se han desarrollado 
mucho más allá de las sugerencias relativamente imprecisas de Skinner. Asimis- 
mo, la noción de la generalización contextual fue criticada por su incapacidad de 
principio para explicar gran parte de las formas de la productividad lingúística (Be- 
ver, Fodor, y Weksel, 19652, 19655). La mayoría de los psicólogos que estudiaban 
el lenguaje aceptaron estos argumentos, y por eso en la actualidad se investigan 
otros modelos de ejecución del aprendizaje de la sintaxis. Se han hecho varios in- 
tentos para resucitar el análisis de Skinner de la conducta verbal, como teoría de 
ejecución que compensara la experimentación seria (MacCorquodale, 1969; Se- 
gal, 1977; Winokur, 1976). La explicación que Skinner proporciona acerca de la 
sintaxis y su adquisición es indudablemente la parte más débil de su análisis, 
mientras que el análisis gramatical es el lado fuerte de la lingúística moderna. 


Algunas funciones de las respuestas verbales 


De acuerdo con la posición conductista, la conducta verbal consiste en respues- 
tas bajo control de estímulo y con consecuencias de estímulo. Pero estas conduc- 
tas pueden prestar diversos servicios al organismo. Muchos psicólogos E-R 
(Dollard y Miller, 1950; Skinner, 1953; Staats y Staats, 1963) se han interesado 
en establecer varias de esas funciones. 
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Veamos algunos de los papeles de las respuestas verbales en un análisis E-R, 
Las etiquetas y expresiones verbales pueden usarse como estímulos discriminati- 
vos para nuestra propia conducta y para la de Otros (como cuando gritamos: 

“corran, fuego””, o ““deja eso'”); se les puede utilizar como estímulos reforzantes 
para nuestra propia conducta y para la de otros (“*correcto””, o *“equivocado'”); y 
para proporcionar incentivo anticipatorio o estímulos motivadores (como cuando 
decimos “mañana me pagarán por este trabajo” u “hoy me pagarán por el trabajo 
que hice ayer””). Además. las secuencias de respuestas productoras de indicios 
que son paralelas a alguna secuencia de evento externo pueden ensayarse verbal- 
mente para fortalecer la cadena, con lo cual “se recuerda'” una secuencia de 
evento externo o una proposición verbaJ. Asimismo, las cadenas de respuestas 
productoras de indicios (palabras u oraciones) se seleccionan y se emplean de ma- 
nera pertinente para resolver problemas. 

Un típico análisis E-R de la resolución de problemas es el que ofrecen Staats y 
Staats (1963, pág. 204) al interpretar un experimento de Judson, Cofer y Gelíand 
(1966). Se dio a los sujetos el problema de las dos cuerdas, de Maier, para que lo 
resolvieran; se trata de una habitación vacía con dos cuerdas que penden varios 
centímetros del techo y se encuentran muy, separados. El trabajo del sujeto con- 
siste en anudar ambas cuerdas, que están demasiado alejadas para que aquél sostenga 
una y alcance la otra. Sin embargo, la otra cuerda puede tomarse si se tensa y se 
le hace mover como un péndulo, Por consiguiente, la solución requiere que se 
anude cualquier objeto asequible en el extremo de una cuerda, y se le haga mover 
como un péndulo en dirección de la otra cuerda, lo cual permite que la persona to- 
me ambas cuerdas y las anude. 

En su experimento, Judson, Cofer y Gelfand demostraron que la solución de es- 
te problema se facilitaba si a los sujetos se les enseñaba primero una lista serial 
verbal, en la cual las palabras cuerda-balanceo-péndulo aparecieran en ese orden. 
En su reconstrucción de este experimento. Staats y Staats usaron el diagrama que 
aparece en la figura 7.6, e identificaron tres aspectos de la conducta general. Pri- 
mero se encuentra el ““tacto”" (rótulo) discriminativo de la situación problemática 
en términos de un estímulo relevante (prestar atención a, y decir **cuerda'”). En 
segundo lugar, está la corrida de la secuencia de respuesta verbal que se aprendió 
antes, cuerda-balenceo-péndulo, la cual se hace asequible a los sujetos experimen- 
tales mediante la tarea previa de aprendizaje verbal, mientras que es menos acce- 
sible para los sujetos de control. En tercer lugar, están las conductas instrumenta- 
les de hacer un péndulo, que se indican por el indicio implícito de decir péndulo, 

La solución al problema puede fallar si se carece de cualquiera de estos compo- 
nentes; es posible que la persona preste atención a características irrelevantes de 
la situación problemática, o tal vez observe la cuerda pero no piense que puede 
usarse como un péndulo; quizá recite la cadena verbal pero no sepa qué es un 
péndulo o desconozca cómo hacerlo. Estos componentes se identifican aquí de una 
forma un tanto burda; sin lugar a dudas, requieren de un análisis funcional mucho 
más profundo (por ejemplo, ¿por qué la persona, después de decir péndulo, se de- 
tene y construye uno en lugar de continuar con sus cadenas verbales 
asociativas?). Staats y Staats creen que este análisis perfeccionado puede llevarse 
a cabo, e ilustran el tema con diversos casos hipotéticos (véase también Staats, 
1968). Sin embargo, desde el punto de vista de otros investigadores que trabajan 
en la resolución de problemas complejos (por ejemplo, Newell y Simon, 1972), es- 
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Figura 7.6. Representación esquemática de una secuencia de resolución de pro- 
blemas. La situación problema es tactuada; entonces ocurre una cadena verbal, que 
conduce a un estimulo implícito que controla la ocurrencia de la respuesta correcta, 
la cual soluciona el problema (tomada de Staats y Staats, 1963). 


te tipo de análisis es demasiado simplificado e ignora la gran cantidad de búsquedas 
infructuosas entre posibilidades irrelevantes, así como los medios para dirigir el 
proceso de búsqueda a lo largo de senderos (“cadenas asociativas”') con probabi- 
lidades de llevar al éxito. Este tema se verá con mayor profundidad en el capítulo 12. 


Autoatribución y conocimiento de sí mismo 


Tal vez Skinner se ha preocupado más que cualquier otro conductista por la 
manera en que los individuos llegan a conocerse a sí mismos, cómo se hacen cons- 
cientes de sus sentimientos y de otros eventos privados que ocurren en su inte- 
rior. Según Skinner, **el ser consciente de ciertos sentimientos'” es Un tipo espe- 
cial de estado de preparación para verbalizar o actuar sobre un complejo de 
estímulos (internos y externos), que son discriminativos para ese sentimiento. 
Así, cuando digo “me duele una muela”, califico un estímulo interno particular; 
cuando digo “siento rabia”” repito un juicio anterior (por ejemplo, en relación con 
actos específicos) acerca de mí, hecho por mí mismo o por otros. 

Al discutir el “juego original de palabras?” mencionamos cómo es que el niño 
aprende tactos (rotulaciones verbales) para los objetos y eventos mediante el re- 
forzamiento discriminativo proporcionado por una comunidad verbal. La misma co- 
munidad puede entrenar a un niño para que describa su propia conducta; por 
ejemplo, se podría entrenar a un pequeño para que informara “me he orinado en 
los pantalones”, “le pegué al gato””, o ““estoy comiendo mucho”. El problema 
surge cuando la comunidad intenta enseñarle a rotular cuentos privados, estímulos 
internos o sentimientos. Los eventos privados afectan exclusivamente al que los 
experimenta; entonces ¿cómo sabe la comunidad cuándo señalar y nombrar al 
evento? 

Al enseñar a un niño a describir el dolor, por ejemplo, un observador debe ense- 
ñarle el rótulo en el momento en que los estímulos críticos lo afecten. La comuni- 
dad verbal identifica estos momentos críticos con base en los estímulos obser- 
vables que afectan al niño (por ejemplo, éste se golpea en la cabeza), o a partir de 
su conducta (llora y se frota la cabeza). Una descripción como “eso es doloroso” 
o “eso duele” podrá establecerse entonces en su repertorio si el observador dice 
**ay, eso es doloroso; sé que debe doler”*, al ver que el niño se golpea en la cabe- 


Cap. 7. El condicionamiento operante de Skinner 249 


za y llora; más adelante, el pequeño imitará y usará esa descripción para golpes y 
magulladuras similares. Una vez establecida, esta respuesta verbal se generaliza- 
rá a una gran clase de eventos dolorosos que producen estímulos internos simila- 
res. Skinner identifica otras dos formas menores de aprender descripciones de 
eventos privados. Una, cuando he aprendido a describir mi conducta manifiesta 
(por ejemplo, mi propia habla), pero esa conducta entonces se vuelve cubierta; a 
continuación de una secuencia verbal cubierta puedo decir: “he estado pensando 
que...””, o algo semejante. Otra manera de aprender descripciones de eventos 
privados es mediante las extensiones o analogías metafóricas, corno cuando en- 
tendemos y aplicamos con rapidez expresiones como '“mariposas en el 
estómago'” para aludir al susto, “'revolverse por dentro”" para la cólera, y “'pin- 
chazos'* o '“burbujas'” para un pie que se ha dormido. Pero éstos son métodos 
menores que cubren pocos casos; los principales medios para aprender términos 
autodescriptivos se dan cuando el padre infiere lo que sucede dentro del niño y lo 
rotula, 


Estos recursos de la comunidad para enseñar al niño un repertorio autodescrip- 
tivo son relativamente pobres comparados con los que se emplean en el entrena- 
miento de las etiquetas discriminativas muy bien afinadas de los estímulos pública- 
mente asequibles. Pero entonces el resultado a menudo es inadecuado, El indivi- 
duo, así como la comunidad, generalmente tiene un conocimiento erróneo o inade- 
cuado de sus estados internos, Por ejemplo, puede ser que una persona nunca 
aprenda a calificar los músculos de su cuello como *“tensos'' o las palmas de sus 
manos como ““hámedas””; de modo similar, la comunidad nunca sabe cuándo infor- 
mar confiadamente de un “dolor de cabeza”” o de una *'descompostura de estó- 
mago'”, cuando se usan como excusa con un valor instrumental obyio (como en la 
enfermedad simulada). Las identificaciones internas que no nos han enseñado son 
aquellas que somos incapaces de hacer y de las cuales somos ““inconscientes*”. La 
investigación en la retroalimentación de mediciones fisiológicas como el electroen- 
cefalograma (EEG u “ondas cerebrales””) y el electromiógrafo (£MG o “tensión 
muscular”*) tiene un gran potencial, ya que tales recursos hacen públicas algunas 
mediciones generales de lo que de otra forma serían eventos o estados exclusiva- 
mente privados; las respuestas que contienen a estos sistemas ahora pueden ro- 
tularse y controlarse de manera consciente mediante el reforzamiento diferencial 
regulado por la retroalimentación amplificada (Kamiya, 1969; reseñado en el 
capítulo 9). 

Significativamente, en el entrenamiento origina) un niño aprende a rotular sus 
propios sentimientos o reacciones emocionales, en parte con hase en la misma 
evidencia observable que la comunidad usa; es decir, en los estímulos externos 
que interfieren (el contexto situacional) y sus propias reacciones a ellos, o la dura- 
ción o intensidad de su conducta. De hecho, cuando los eventos internos, los sen- 
timientos o las actitudes son vagos, amorfos y poco claros, las autodescripciones 
de una persona pueden depender más de lo normal de estas circunstancias exter- 
nas o de sus respuestas. Esta situación se ilustra en un clásico experimento de 
Schachter y Singer (1962), quienes lograron evocar sentimientos emocionales tan 
dispares como la euforia y la cólera en sujetos en el mismo estado fisiológico de 
excitación inducida por drogas, dependiendo de si se les colocaba con un aliado del 
investigador (**sujeto impostor'”) que mostraba euforia, o con uno que mostraba 
reacciones de cólera, Como los sujetos experimentaban inexplicables síntornas de 
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excitación, buscaban en su medio ambiente pistas que les ayudaran a interpre- 
tarla, y esa interpretación era la felicidad o la cólera correspondiente a si el otro 
sujeto parecía contento o enojado. 

Esta línea de análisis forma la base de la teoría de la autopercepción, que en la ac- 
tualidad goza de gran influencia entre los psicólogos sociales que estudian el cam- 
bio de las actitudes (Bem, 1967, 1972; Jones ef al., 1971). La piedra de toque de la 
teoría de Bem es que las actitudes de una persona corresponden a sus autopercep- 
ciones. 

Las dos premisas centrales de la teoría de autopercepción son las siguientes: 


1. los individuos Jegan a ““conacer”” parcialmente sus propias actitudes, emociones y 
otros estados internos al inferirlos de las observaciones de su propia conducta abierta y/o 
de las circunstancias en jas cuales aparece esta conducta. 

2. según el grado en que los indicios internos sean débiles, ambiguos o imposibles de in- 
terpretar, el individuo se encuentra funcionalmente en la misma posición que un observa- 
dor externo, un observador que necesariamente depende de los mismos indicios externos 
para inferir los estados internos del individuo (Bern, 1972, pág. 2). 


Este tipo de teoría ha probado ser útil en la interpretación de los resultados de 
numerosos experimentos del cambio de las actitudes, dirigidos originalmente para 
apoyar la teoría de Ja disonancia cognoscitiva; por ejemplo, el que los sujetos que 
son inducidos a la representación de un papel y argumentan en contra de su opi- 
nión inicial acerca del mismo tema cambiaran, en consecuencia, su opinión verda- 
dera de forma drástica en la dirección de la posición del papel que desempeñan. 
Para obtener la información pertinente a estas hipótesis, pueden consultarse las 
referencias citadas. Pero es interesante señalar que las hipótesis que en ha actuali- 
dad sobresalen en la psicología social se derivan en parte del análisis conductista 
de Skinner de la experiencia privada. 


Personalidad y psicoterapia 


Las teorías psicodinámicas clásicas de la personalidad, como la de Freud, presu- 
ponen que la persona posee un conjunto de rasgos de la personalidad, motivos y 
conflictos básicos que son duraderos y persistentes en el transcurso del tiempo y a 
través de diferentes situaciones. La conducta, ya sea normal o desequilibrada, 
es supuestamente una expresión sintomática de esos rasgos y motivos profundos. 
Cuando fos conflictos y la ansiedad internos se vuelven demasiado intensos para 
soportarlos, el aparato mental ““falla”' y expresa la turbulencia interna en términos 
de un síntoma irracional y neurótico. 

Skinner (1963, y en otros textos) rechaza específicamente esta interpretación. 
Para €l, los motivos, deseos o apetencias no son explicaciones de la conducta. 
Afirmar que un hombre pasa demasiado tiempo dedicado al aseo y arreglo perso- 
nal es porque “tiene ua necesidad o deseo compulsivo de limpieza** no explica 
nada. Tan sólo hace retroceder un paso a la pregunta: ¿por qué lo tiene?, ¿qué de- 
termina ese deseo? Skinner va más allí de esas inútiles ““explicaciones de motiva- 
ción”” y propone que analicemos los sucesos observables, las condiciones, las va- 
riables de situación y la historia pasada que regulan la conducta en cuestión. 

Para €l la conducta ha de explicarse en términos del complejo de estímulo pre- 
sente y de la historia de entrenamiento pasada de la persona, en lo que respecta a 
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situaciones similares. La historia pasada proporciona a la persona una gran reser- 
va de información, habilidades y valores (analizables en términos objetivos). Las 
descripciones de los rasgos mentales de un individuo son relativamente inútiles, 
debido en primer lugar a que tienen una correlación muy pobre con la manera en 
que una persona se comporta en verdad a través de una diversidad de situaciones 
sociales (véase Mischel, 1968), y segundo, porque la descripción de rasgos no su- 
gere ninguna variable independiente que podamos manejar para controlar la con- 
ducta. 

De acuerdo con el análisis de Skinner, un neurótico es alguien que ha aprendido 
a comportarse de formas que son reprobables desde el punto de vista personal, le- 
gal o social, y a las cuales se considera entonces desviadas. Como la conducta 
neurótica se aprende, se le puede desaprender o sustituir con una conducta mejor 
ajustada. La forma más simple de lograrlo consiste en disponer las contingencias 
de tal modo que las conductas indeseables dejen de recibir recompensas y las con- 
ductas deseables empiecen a recibirlas, A pesar de lo sencillo que parece, en la 
práctica esto suele ser difícil de realizar debido a frecuentes dificultades en la identif- 
cación de los reforzadores que sostienen a la conducta desviada, en la medición de la 
conducta problemática, y en la consecución de las contingencias que han de aplicarse 
consistentemente, etc. Quienes trabajan en el campo de la modificación de la conducta 
tienen el mérito de haber solucionado estos difíciles problemas en situaciones de cam- 
po. Los resultados terapéuticos generalmente son formidables y muy benéficos. En el 
capítulo 9 se verán diversas aplicaciones de las técnicas de modificación de la conducta 
operante. De cierta forma, éstas constituyen los logros prácticos más impresionantes 
del movimiento conductisa, 

Sin embargo, a pesar de lo espectacular de las aplicaciones de las técnicas ope- 
rantes, es un error suponer que su éxito “*constituye una prueba'* de que el enfo- 
que de Skinner de los fénomenos psicológicos es correcto, Estas aplicaciones de- 
muestran los beneficios que pueden obtenerse mediante el análisis conductual, el 
uso juicioso de las técnicas de reforzamiento y de control del estímulo; pero la ley 
empírica del efecto o les hechos de la discriminación del estímulo nunca se han dis- 
cutido en la teoría del aprendizaje. Tales aplicaciones generalmente se diseñan pa- 
ra problemas individuales, en vez de ser analíticas y útiles para decidir entre dife- 
rentes interpretaciones teóricas. 


APRECIACIÓN DEL SISTEMA DE SKINNER 


La posición de Skinner acerca de las problemas típicos 
del aprendizaje 


La existencia de libros de texto escritos desde el punto de vista skinneriano per- 
mite hacer un sumario de esta posición en relación con varios problemas. 

1. Capueidad. El repertorio conductual de un organismo individual debe evaluar- 
se con sumo cuidado y tenerse en cuenta a la hora de moldear cualquier conducta 
específica. Un déficit en la conducta de alguna persona a menudo se atribuye a una 
deficiencia en su entrenamiento o en su ambiente. Se parte de la idea de que la 
conducta es muy moldeable, y de que (dentro de ciertos límites) casi todas las per- 
sonas pueden ser moldeadas, con el entrenamiento adecuado, hasta lograr cierta 
destreza en cualquier conducta. En lo que toca a las diferencias individuales, Skin- 
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ner está en favor de la evaluación directa de las conductas blanco, y en contra de 
las descripciones de los rasgos de la personalidad, como agresivo, flajo o retrasa- 
do. El nombrar a un rasgo no se refiere a ninguna unidad de conducta adecuada pa- 
ra el estudio mediante el análisis funcional que recomienda (1953, págs. 194 a 
203). Asi, Skinner rechazaría la mayor parte de las pruebas de personalidad, al 
afirmar que proporcionan una caracterización inútil de la persona. Las pruebas de 
inteligencia podrían ser provechosas para decisiones educativas, ya que muestrean 
directamente las habilidades de resolución de problemas que intentan medir, pero 
no nos dicen cómo remediar la falta de habilidades o deficiencias educativas 
especificas. 

2. Práctica. En lo que se refiere al condicionamiento del tipo E (pavloviano), se 
acepta algo así como una ley simple del ejercicio (práctica en condiciones de contigúi- 
dad del estímulo y la respuesta). Sin embargo, el condicionamiento que se produce 
bajo el tipv R (operante), depende del reforzamiento repetido. El condicionamien- 
to máximo puede aparecer en un solo ensayo para la operante de una sola unidad; 
sin embargo, esto es difícil de lograr experimentalmente. Por lo general, la 
acumulación de fuerza con el reforzamiento repetido depende de una población de 
estímulos discriminados y de una cadena de operantes relacionadas, semejante a 
la interpretación que hace Guthrie de la adquisición de la habilidad mediante la 
práctica. 

3. Motivación. La recompensa o el reforzamiento son necesarios para incremen- 
tar la fuerza operante. El castigo tiene un rango diverso de efectos, aunque nor- 
malmente suprime la respuesta. El uso común de los términos motivacionales hu- 
manos como interés, apatía, felicidad, depresión, etc., se refiere pur lo general a 
las consecuencias de contingencias de reforzamiento eficaces o ineficaces. Skin- 
ner suele considerar a los impulsos internos como constructos explicativos relati- 
vamente inútiles, similares a los rasgos de la personalidad. Reconoce los efectos de 
las variables de privación explícita sobre la fuerza de las operantes reforzadas por 
esa comodidad restringida, pero afirma que al hablar acerca de un ““impulso”” que 
interviene entre las operaciones de privación y los cambios en la fuerza de las res- 
puestas operantes, no se agrega nada al anátisis funcional. 

4. Comprensión, La palabra discernimiento raras veces aparece en las obras de 
Skinner. Keller y Schoenfeld identifican el discernimiento con la descripción verbal 
de las contingencias de aprendizaje, que generalmente producen un cambio subse- 
cuente de la conducta bajo el control de estímulo de esa descripción verbal. La 
resolución de problemas por lo regular implica el tacto (rotulación) apropiada de la 
situación problemática, después la activación de una regla verbal adecuada o una se- 
cuencia de respuesta que conduzca a un indicio de mediación para la conducta de 
solución (como en el análisis de Staats y Staats del problema de las dos cuerdas). 
La emergencia de la solución ha de explicarse con base en la similitud del problema 
actual con uno resuelto antes o en la sencillez del problema (F. S. Keller y Schoen- 
feld, 1950, pág. 60). La técnica de la resolución de problemas en esencia consiste 
en manipular variables ('“indicaciones”* o estímulos internos o externos) que con- 
duzcan a la emisión de la respuesta. Mediante estos métodos es posible enseñar a 
la gente a “pensar” oa “ser creativa” (Skinner, 1953, págs. 252 a 256). 

5. Transferencia, Skinner empleaba la palabra inducción para lo que suele deno- 
minarse generalización en la bibliografía acerca del condicionamiento. Tal induc- 
ción es la base de la transferencia. Al igual que otros investigadores, Skinner reco- 
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noce la generalización primaria y la ““secundaria”” o ““mediada””. El reforzamiento 
de una respuesta incrementa la probabilidad de esa respuesta u otras similares a 
todos los complejos de estímulo que contengan los mismos elementos. Se incluye 
b estimulación de retroalimentación de rótulos verbales; así, una respuesta manú- 
fiesta ocurrirá a un nuevo objeto si alguna de sus propiedades controla un rótulo 
verbal, que a su vez controla la respuesta abierta. Por lo tanto, al haber aprendido 
a disparar con un revólver a los soldados con uniforme verde en una zOna particu- 
lar de tiro, un hombre también disparará con rifle a cualquier soldado nuevo que 
vea vestido con uniforme verde en el mismo lugar. Esta interpretación general de 
h transferencia es, de hecho, muy similar a la de Thorndike. 


DIFICULTADES DE LA POSICIÓN DE SKINNER 


A medida que la psicología progresa, se espera que se descubran nuevos fenóme- 
nos que no se contemplaban, y que se propongan nuevos conceptos que planteen 
interrogantes acerca de posiciones históricas específicas. A lo largo del tiempo, 
esto ha sucedido con varias de las ideas iniciales de Skinner de manera que una 
evaluación equilibrada de sus lineamientos deberá tener en cuenta las dificultades 
que implica la perspectiva temporal. 


Algunas dudas en torno de la distinción entre 
operante y respondiente 


La distinción entre operante y respondiente propuesta por Skinner y Otros auto- 
res habría de dorninar la teoría del aprendizaje durante casi 30 años. Se le de- 
nominaba teoría de dos factores y proclamó sus derechos sobre un número de 
fenómenos con los cuales guardaba correspondencia. Las respuestas de las glán- 
dulas y de los órganos internos (sespondientes) se distinguen (hipotéticamente) por 
los siguientes rasgos: 


a) Son provocadas por estímulos innatos, incondicionados. 

b) Están controladas por el sistema nervioso autónomo. 

c) Generalmente son ““involuntarias”. 

d) Se caracterizan por una retroalimentación mínima producida por la respuesta. 
e) Pueden condicionarse clásicamente pero no de modo operante. 


En severo contraste, las características de las respuestas de los músculos 
estriados y periféricos (operantes) son las siguientes: 


a) Algunas veces se emiten sin estímulos identificables. 

bJ Son controladas por el sistema nervioso central. 

c) Se controlan **voluntariamente”” . 

d) Se distinguen por su retroalimentación propioceptiva distinta. 

e) Pueden condicionarse de modo operante pero no de manera clásica. 


Esta separación conceptual y su conjunto de correspondencia originaron análi- 
sis, críticas y nuevas formulaciones (Rescorla y Solomon, 1967; Staddon y 
Sirunelhag, 1971; Terrace, 1973). Especificamente, ahora parece probable que 
algunas respuestas viscerales mediadas por el sistema nervioso autónomo pueden 
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modificarse con éxito mediante las técnicas de condicionamiento operante (N. E. 
Miller, 1969). Así, por ejemplo, un perro sediento puede aprender a salivar o a re- 
tener la salivación a fin de conseguir un poco de agua, o a una rata se le puede en- 
señar a contraer el intestino a una señal externa cuando a tales contracciones si- 
gue una recompensa. Estos importantes resultados acerca del condicionamiento 
operante de respondientes supuestamente involuntarios se examinarán en el 
capítulo 9. La conclusión actual es que los datos indican que la distinción entre ope- 
rante y respondiente puede no sobrevivir a su utilidad. Terrace, un skinneriano, 
sostiene convincente mente la necesidad de modificar la teoría de dos factores. 

Examinemos otra evidencia que a menudo se cíta para establecer la distinción 
entre operante y respondiente. En una época se creía que las RC pavlovianas se 
distinguían por ser similares a su respuesta incondicionada; ésta es la idea de sws- 
fitución, según la cual el EC termina por reemplazar al El en la provocación de una 
respuesta común. De ser así, el condicionamiento operante diferiría del pavloviano, 
en el sentido de que la RC operante no necesita parecerse a la respuesta del 
estímulo reforzante. Pero la semejanza de la RC y de la RI no es una 
característica decisiva de las respuestas condicionadas operante-respondiente. 
Por ejemplo, a una rata sedienta se le puede entrenar para que chupe en un bebede- 
ro seco (respuesta operante) con la aparición contingente de una gota de agua Oca- 
sional, que sirve para recompensar la respuesta y provocar más chupeteos (reflejo 
respondiente). Como otro ejemplo contrario al criterio de semejanza, en diversas 
preparaciones de condicionamiento pavloviano, la reacción fisiológica inicial al 
estímulo incondicionado puede ser contrarrestada por una reacción compensato- 
ría, y es esta última reacción la que llega a evocarse como una respuesta condi- 
cionada al EC. Siegal (1978) descubrió que aunque una inyección de morfina redu- 
ce la sensibilidad al dolor en las ratas, un EC pareado repetidas veces con la morfi- 
na aumenta la sensibilidad al dolor (otros indicadores fisiológicos muestran patro- 
nes opuestos similares para el EC y el ED. 

Otras observación es que los procesos clásico e instrumental se superponen 
considerablemente. Un análisis profundo del condicionamiento clásico (por 
ejemplo, el paradigma del condicionamiento de la salivación) revela que varias res- 
puestas esqueléticas (''operantes”*) se asocian con el estímulo condicionado, co- 
mo la orientación hacia el comedero, los movimientos anticipatorios de mascar, el 
meter la cabeza en el comedero, etc., todas ellas además del flujo salival que 
Pavlov midió y destacó (Zener, 1937). De modo similar, en el condicionamiento 
instrumental está establecido con claridad que los componentes de la respuesta 
provocada por el reforzador se llegan a condicionar y ocurren como anticipa- 
ción a éste. Así, cuando un perro empieza a presionar varias veces una palanca pa- 
ra conseguir comida, también comienza a salivar (Shapiro, 1961; D. R. Williams, 
1965). De este modo, tanto la conducta operante como la respondiente parecen 
estar condicionadas en cualquier tipo de experimento. 

La diferencia fundamental entre el condicionamiento instrumental y el clásico se 
reduce básicamente a la del procedimiento experimental, la forma en que los reforza- 
mientos (léase “estímulos incondicionados”*) se programan. Pero éstos son procedi- 
mientos intermedios y casos de prueba no resueltos. Un buen ejemplo es que lo que se 
denomina condicionamiento supersticioso, un fenómeno del que Skinner fue el prime- 
ro en informar (1948b) y en discutir en términos de condicionamiento operante. Su- 
póngase que una paloma hambrienta está acostumbrada a comer de un recipiente 
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con granos dentro de una caja cerrada; el alimentador se opera periódicamente (por 
ejemplo, por tres segundos cada 30 segundos) durante varias sesiones experimen- 
tales prolongadas. A pesar de que el reforzamiento (presentación del comedero) 
no es contingente de ninguna conducta particular, la paloma adquiere a la larga 
alguna cadena de respuestas ritual y estereotipada que emite entre los reforzamien- 
tos; diferentes animales escogen distintas supersticiones. Esto se explica de la si- 
guiente manera: cuando el reforzamiento se entrega por primera vez la paloma se 
comporta de alguna forma, de moro que esta '*aperante”” se fortalece. Entonces es 
más probable que esta misma conducta, quizá con pequeñas modificaciones, esté en 
marcha cuando se reciba el siguiente reforzamiento. De ser así, se fortalece todavía 
más; si no, se fortalecerá alguna otra conducta. A la postre la paloma se ve '“atrapa- 
da” en una secuencia operante particular, que ocurre y es reforzada con la misma 
frecuencia que la mantiene. Los comportamientos supersticiosos conspicuos de una 
paloma podrían incluir acciones como '*voltear bruscamente hacia un lado, saltar con 
una pata y otra hacia atrás, doblar la cabeza y raspar, darse la vuelta, pavoneamse y 
levantar la cabeza*” (Skinner, 1953, pág. 85). También se han efectuado numerosas 
demostraciones del aprendizaje de '*supersticiones'” en los seres humanos expues- 
tos a reforzamiento aleatorio y no contingente (Wright, 1960), de modo que existen 
pocas dudas acerca del efecto, 

Para Skinner, el experimento de superstición significaba que cada vez que se le 
entrega un reforzamiento a un organismo, se fortalece cualquier conducta Operan- 
te que esté en marcha en ese momento. El efecto de fortalecimiento se produce 
independientemente de que la operante dominante sea o no instrumental para 
causar el reforzador; desde el punto de vista del organismo, la contigiidad tempo- 
ral entre la respuesta y el reforzamiento es el factor de importancia. La coinciden- 
cia temporal se interpreta como causalidad: es como si el organismo creyera que 
sus acciones supersticiosas producen al reforzador. 

Staddon y Simmelhag (1971) repitieron el experimento de superstición con palo- 
raas y lograron resultados similares, aunque lo interpretaron de otra manera. Ob- 
servaron que los comportamientos supersticiosos emitidos por las palomas duran- 
te el intervalo entre los reforzamientos se parecían a las reacciones específicas del 
tipo que muestran mientras comen o cuando anticipan la comida, Las reacciones 
consistían principalmente en picotear el recipiente vacio (donde se entregaban los 
granos), la pared o el piso, Inmediatamente después de un reforzamiento, que se- 
ñalaba una demora fija antes del siguiente, cada palorna ejecutaría algún comporta- 
miento variable; pero a medida que se acercaba el momento del reforzamiento, re- 
tornaba a su mtina de picotear cerca de! comedero, Staddon y Simmelhag creían 
que en vez de fortalecer determinadas respuestas Operantes en marcha, los refor- 
zamientos de intervalo fijo daban lugar a la anticipación del momento de la comida, 
y que la conducta terminal sólo se asemejaba a la de comer. Sin embargo, no está 
claro cómo se aplica este análisis o cómo explica las supersticiones humanas como 
las danzas de la lluvia y cosas parecidas; en esos casos, la ocurrencia de la lluvia 
necesaria no produce el baile, sino únicamente la reflexión y la creencia de que la 
danza la ha ocasionado. 

Curiosamente, Pavlov (1927) también estudió e informó de un arreglo de refor- 
zamiento periódico similar con sus perros, con la excepción de que registró la sali- 
vación. Cada vez que transcurría un cierto número de minutos (por ejemplo, cinco 
minutos) se alimentaba al perro en el estrado experimental, y este ciclo se repetía 
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a menudo. Paviov descubrió que a la larga el animal aprendía a salivar cerca del mo- 
mento esperado para la entrega del alimento. Como Pavlov pensó que el mero paso 
del tiempo desde el último reforzamiento se convertía en un estímulo condicionado 
para evocar la salivación condicionada, calificó a este arreglo como condiciona- 
miento temporal, una forma de condicionamiento clásico. 

Pero como el programa de eventos en el experimento de superstición y en el 
condicionamiento temporal son idénticos, ¿por qué hemos de llamar a uno condi 
cionamiento “clásico”? y al otro *“instrumental''?, ¿debido a los tipos de respues- 
tas registradas en ambos experimentos? Pero hace poco se dijo que muchas de las 
llamadas respondientes (como la salivación) pueden condicionarse mediante el uso 
del reforzamiento operante; de modo similar, algunas respuestas esqueléticas (co- 
mo el parpadeo y el reflejo patelar) pueden condicionarse de acuerdo con la rutina 
del condicionamiento clásico. Así, el sistema de respuesta no dicta necesariamen- 
te diferentes leyes de aprendizaje. 

El condicionamiento clásico y el instrumental pueden incluso oponerse uno al 
otro al recompensar al sujeto por retener una respuesta ante una señal, pero en 
una situación en la cual el EJ recompensante provoca la respuesta que ha de repri- 
mirse. Un ejemplo de esta contingencia, diseñado por F. D. Sheffield (1965) y lla- 
mado entrenamiento de omisión, consiste en reforzar a un perro hambriento con 
comida sólo si zo saliva frente a una señal. Shapiro y Herendeen (1975) lograron 
un condicionamiento operante exitoso con este procedimiento: sus perros apren- 
dieron a '*mantener Ja boca seca” a fin de conseguir alimento. Al concluir el entre- 
namiento, los perros retenían la salivación y eran alimentados en alrededor del 
80% de los ensayos con el EC. Un investigador que se adhiriera a la teoría de dos 
factores podría argumentar que el 80% de ensayos reforzados resultaba insufi- 
ciente para sostener una RC clásica, o que la RC clásica que se desarrolla será dé- 
bil y oscilará a través de los pequeños ciclos de adquisición y extinción al rastrear 
la ocurrencia y no ocurrencia del ET a lo largo de los ensayos, Pero Shapiro y He- 
rendeen aplicaron controles que excluían tales explicaciones. Primero, los anima- 
les de control pareados recibieron la misma secuencia de ensayos de comida y no 
comida que sus compañeros experimentales, y de todos modos mostraron un ele- 
vado mivel de condicionamiento salival, de manera que el 80% del programa de re- 
forzamiento fue lo bastante rico como para mantener una RC clásica muy buena 
cuando no se aplicaba la contingencia de respuesta negativa. Segundo, los análisis 
ensayo por ensayo revelaron que los animales entrenados con la contingencia de 
respuesta negativa eran cada vez más propensos a x0 salivar ante la señal, cuanto 
más larga hubiese sido la anterior corrida de ensayos en los cuales fueron reforza- 
dos por hacerlo. Esto no sólo es lo contrario del efecto secuencial esperado me- 
diante la ley del condicionamiento clásico, Parecería, por tanto, que el condiciona- 
miento clásico no es una consecuencia necesaria de los pareamientos EC-El en el 
tiempo; tampoco es la “última respuesta”” ejecutada al EC (salivación) la que se 
fortalece, que es lo que Guthrie habría esgrimido. 

La perspectiva que estas consideraciones parecen sugerir (véase Terrace, 
1973) constituye un retorno a la teoría de un factor del reforzamiento que Hull orig 
nalmente defendía. Es decir, el condicionarmento clásico implica el mismo princi- 
pio de reforzamiento ('“aprendizaje de recompensa'”) que el condicionamiento 
operante, a excepción de que la respuesta registrada y sus medios de provocación 
inicial difieren en los dos casos. Hay diversas formas de concebir que la comida, co- 
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mo recompensa, podría fortalecer la salivación anticipatoria en el condicionamien- 
to pavloviano, Primero podríamos decir tan sólo (como afirmaba Hull) que el co- 
mer provoca —y simultáneamente refuerza ('“recompensa'")— la salivación. Se- 
gundo, cabría suponer que la RC anticipatoria es reforzada diferencialmente porque 
hace que el £7 siguiente sea más recompensante (que si la RC no hubiera ocurri- 
do). Así, según esta hipótesis, la salivación anticipatoria incrementa el gusto, el 
buen sabor y el valor recompensante de la comida que viene a continuación, Esta 
opinión, que ya había sido propuesta por Perkins (1955), tiene mucho en su favor, 

especialmente en aquellos casos donde el acto preparatorio reduce el carácter des- 
agradable de un estimulo aversivo, Perkins también muestra la manera en que 
esta premisa acerca de las respuestas preparatorias apropiadas que incrementan 
los valores de la recompensa, puede explicar el aprendizaje de respuestas de obser- 
vación pura: Éstas son respuestas especiales que no tienen otra utilidad que pro- 
porcionar información que prepara el animal para los eventos reforzantes inminen- 
tes (G. H. Bower et a!., 1966). Una tercera idea del condicionamiento pavloviano 
es la del aprendizaje de expectancia, que no requiere reforzar una respuesta de sal+ 
vación. Debido a los pareamientos EC-ET, el EC adquiere la facultad de hacer que 
el sujeto piense en el Ef o lo espere; y en la mayor parte de los casos la expectati- 
va de un E] causa una reacción, que a menudo se asemeja a la respuesta al El mis- 
mo, aunque no necesariamente. Pero esto no explica los resultados de Shapiro y 
Herendeen (1975). 

Cualquiera que sea la formulación correcta del condicionamiento pavloviano, es 
evidente que la estricta dicotomía de Skinner respecto a las clases de respuestas y 
alas leyes del condicionamiento respondiente y operante, parece errada. Su punto 
de vista inicial acerca de estos importantes temas ya no es sostenible. A conti- 
nuación se examinarán otras complicaciones que surgen en torno de la posición de 
Skinner. 


Preparación 


Como hemos visto en el capítulo 3, hay cada vez más evidencia que refuta al 
postulado de la eguipotercialidad al que Skinner y atros teóricos del aprendizaje se 
han adherido implícitamente (lo cual justifica el uso de respuestas tan arbitrarias 
como la de la rata que presiona una palanca). El postulado en cuestión presupone 
que cualquier respuesta que el organismo es capaz de dar puede vincularse con cual- 
quier estímulo discriminable para cualquier estírmulo reforzante; y el aprendizaje 
de la contingencia de tres términos sólo depende de las identidades independien- 
tes de los tres términos, y no de la relación de éstos en lo que toca a carácter 
apropiado o pertenencia natural. La evidencia revisada por Seligman (1970) pro- 
porciona ejemplos contrarios; un estímulo puede provocar respuestas innatas que 
compiten fuertemente con la que habrá de aprenderse; o una respuesta dada pro- 
pia de la especie (por ejemplo, el aullido en un perro) puede ocurrir sólo ante 
estímulos específicos y no ser condicionable a otros estímulos; o un reforzador 
puede alistar un conjunto de actividades instintivas que compiten con la operante 
arbitraria que habrá de establecerse en la contingencia de tres términos. Por 
ejemplo, Breland y Breland (1960) informaron de muchos casos de conducta ins- 
tintiva estrechamente vinculados con la comida, que comenzaban a inmiscuirse 
con antelación a la entrega de alimento, interferían con la respuesta operante 
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correcta y demoraban el reforzamiento. Seligrian propone una clasificación de con- 
tingencias £-R-E en términos de si los individuos de una especie dada están pre- 
harados o contrapreparados para efectuar esas uniones. Un ejemplo de una co- 
nexión preparada es la relación entre una molestia intestinal y la náusea provocada 
por un nuevo sabor, mientras que el animal está contrapreparado para vincular la 
misma molestia con una luz centellante. Otro ejemplo es el **automoldeamiento”' 
del picoteo enlas palomas, tema que veremos a continyación. 


Automoldeamiento 


Cuando Skinner sometió a prueba por primera vez a sus palomas en la cámara 
de condicionanuento, escogió como respuesta, más o menos arbitrariamente, el 
picoteo del ave sobre una llave iluminada montada en una pared sobre el comedero 
al nivel de la cabeza. El reforzamiento se proporcionaba mediante un acceso de 
pocos segundos a un recipiente con semillas, en el cual la paloma picoteaba y 
comía. La elección del picoteo de la llave resultó ser afortunada y se obtuvo un rá- 
pido condicionamiento. Sin embargo, vista en retrospectiva, esa elección también 
ha complicado los análisis del condicionamiento operante. 

La complicación surge a consecuencia de que las palomas están sumamente pre- 
paradas para picotear objetos luminosos distintivos cuando anticipan el reforza- 
miento alimenticio; el picoteo es un patrón de acción innato y específico de la espe- 
cie, activado en las palomas por la búsqueda de comida. En un estudio clásico, P,L, 
Brown y Jenkins (1968) descubrieron que las palomas hambrientas podían ser 
entrenadas para que picotearan una llave iluminada de respuesta, cuando el expe- 
rimentador iluminaba la llave durante unos segundos antes de que se entregara la 
comida. A fin de condicionar ese picoteo, no es necesario que el reforzamiento se 
haga contingente de picotear en la llave. Ese fenómeno, llamado eutomoldeamien- 
to —ya que el animal se moldea a sí mismo para responder— es rmuy confiable, po- 
deroso y se ha estudiado mucho desde entonces. Aparentemente, el picoteo auto- 
moldeado en la llave es un ejemplo de una RC pavloviana. La luz sobre la llave, 
que aparece justo antes de que a la paloma se le permita picotear las semillas, con- 
vierte a la llave iluminada en un EC para picotear en el alimento; a partir de enton- 
ces el repertorio innato de la paloma toma e! control y hace que picotee un punto 
iluminado que le recuerda a la comida. El automoldeamiento avanza con mayor ra- 
pidez cuanto más se asemeje el punto de luz sobre Ja llave a un grano de comida. 
El condicionamiento de los picoteos mediante el procedimiento de automoldea- 
miento también respeta casi todas la leyes del condicionamiento pavloviano. Inclu- 
so, es posible obtener condicionamiento de segundo orden en la situación de auto- 
moldeamiento (Rashotte et al., 1977). D.R. Williams y H. Williams (1969) no logra- 
ron entrenar a sus palomas para que se abstuvieran de picotear la llave iluminada a 
fin de obtener comida (el procedimiento de entrenamiento de omisión ya men- 
cionado). Si la paloma se abstuviera de picotear la llave ihuminada, se le alimentaría 
en pocos segundos; pero si la picoteaba, la huz se apagaba y en ese ensayo perdía 
el alimento. En la mayor parte de los ensayos del experimento de Williams y 
Williams, las palomas eran incapaces de dejar de picotear la llave, Esta circunstan- 
cia indica que el componente pavloviano del arreglo de automoldeamiento es más 
poderoso que el componente de reforzamiento operante. 

El fenómeno del automoldeamiento originó que lqa investigadores estudiaran 
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más de cerca las reacciones específicas de la especie al reforzador, y la manera en que 
éstas se relacionan con la respuesta requerida para obtener reforzamiento en 
el experimento de condicionamiento operante. Observaron que la llamada res- 
puesta operante a menudo tiene componentes que se asemejan mucho a la forma 
de la conducta respondiente provocada por el reforzador. Un ejemplo que men- 
ciona Moore (1973) es que el modo exacto en que las palomas golpean la llave di- 
fiere, dependiendo de si picotean para obtener una recompensa de alimento o de 
agua. El picoteo de la llave para alimento se parece a los arranques súbitos para 
capturar semillas; el picoteo para obtener agua se asemeja a los movimientos 
característicos de recoger agua con el pico. Ambos son efectos muy sutiles. 

La existencia de componentes pavlovianos en la **operante”” prototípica del pi- 
coteo de llave de la paloma introdujo complicaciones conceptuales que Skinner no 
había previsto en sus principios del condicionamiento operante, El automoldea- 
miento no constituye ni una refutación ni un estigma para el sistema de Skinner; 
más bien señala un complicado giro en lo que antes se consideraba simple: la natu- 
raleza de la respuesta. 


Debilitamiento paulatino del interés intrínseco 


Una pregunta frecuente que padres y maestros plantean a los psicólogos es si el 
hecho de recompensar explícitamente una actividad en la que vn niño (o adulto) 
debería interesarse por su propio bien (como la lectura), debilita el interés 
intrínseco por esa actividad. La pregunta es importante, ya que plantea la posibili- 
dad de efectos secundarios indeseables de las recompensas operantes explícitas. 
Estos temores recibieron cierto apoyo por parte de un estudio de Lepper, Greene 
y Nisbett (1973) acerca del interés de los niños en edad preescolar por dibujar con 
marcadores, una nueva actividad que les parecía relativamente interesante y di- 
vertida. Algunos niños dibujaban con el conocimiento de que recibiefan un juguete 
deseado si hacían bastantes dibujos para el experimentador, y todos recibían la re- 
compensa. Los niños de control podían dibujar si así lo deseaban, pero no $e men- 
cionaba ningún premio, y tampoco se les otorgaba. Más adelante, en los periodos 
de juego en sus salones de clases regulares, se observaba que los niños recom- 
pensados pasaban menos tiempo que sus compañeros de control dedicados a dibu- 
jar con los marcadores y a esta actividad la clasificaban como menos interesante 
que otras, Lepper y sus colegas inicialmente sugirieron que una recompensa 
extrínseca “justifica en exceso” el dedicarse a una tarea interesante y, por tanto, 
reduce el interés intrínseco. Una interpretación posterior es que los niños recom- 
pensados terminaban por considerar a la actividad recompensada como algo que 
hacían “sólo por el premio”, y por eso no la realizaban cuando éste no existía. 

Aunque los resultados de Lepper se han repetido en diversos experimentos, 
Feingold y Mahoney (1975) y Reiss y Sushinsky (1975) no encontraron los efectos 
secundarios negativos de la recompensa en los niños que unían puntos en un libro 
ilustrado para trabajar de esa manera. Al parecer, una diferencia crítica es que el 
“interés!” del niño se comprueba o no (sin recompensas externas) en la misma si- 
tuación que la de entrenamiento recompensado. Los estudios de Feingold y 
Mahoney, y los de Reiss y Sushinsky emplearon situaciones muy similares para el 
entrenamiento y la comprobación, y no observaron una declinación posterior del 
interés en los sujetos recompensados, quizá porque aún creían que recibirían al- 
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gún premio (aunque sólo fuera elogios) por sus esfuerzos. Por otra parte, Lepper 
y sus colegas observaron a los niños en el salón de ciases, donde no había ningún 
*““experimentador”” presente, y que era muy distinto de la situación de laboratorio 
donde se había dirigido la sesión recompensada. En una prueba directa de esta hi- 
pótesis de generalización, Lepper, Greene y Sagotsky (1978) descubrieron que los 
sujetos recompensados a los que se volvía a someter a prueba en el laboratorio y 
con la presencia del experimentador (ahora sin promesa de recompensa), no 
mostraban una reducción por debajo de sus controles en la tasa de dedicarse a una 
actividad anteriormente premiada, mientras que los niños recompensados sí 
mostraban el efecto negativo cuando se les observaba en la situación de juego en 
el salón de clases; allí se dedicaban a la actividad objetivo con menos frecuencia 
que los sujetos de control. 

Lepper sugiere que un maestro o un padre no debería utilizar recompensas ex- 
ternas para promover una conducta deseada, a no ser que los premios claramente 
se necesiten para inducir el interés. Esto sugiere precaución al instalar economías 
de fichas 0 sistemas extrínsecos para cada tarea en una clase o grupo completo de 
personas, independientemente de si un individuo en particular requiere la recom- 
pensa para motivar su interés en la tarea. Sin embargo, este tema aún no se ha re- 
suelto totalmente y es probable que se convierta en fuente de continuos debates y 
experimentación. Pero sí sugiere ciertas críticas severas en torno de una in- 
terpretación sencilla del fortalecimiento operante mediante las recompensas ex- 
ternas. 


e. 
Distinción entre aprendizaje y ejecución 


Skinner siempre ha considerado a los reforzadores en el sentido de que fortale- 
cen directamente a las operantes, y aplica muy poco la distinción entre aprendizaje 
y ejecución, que ha sido central para otras teorías del aprendizaje. Este tema 
cobra nuevo interés cuando puede demostrarse que alguien ha aprendido algo bas- 
tante bien y sabe cómo realizarlo, pero no lo ejecuta por falta de reforzamiento. 
Por ejemplo, Bandura, Brusec y Menlove (1966) hicieron que sus niños observa- 
Tan a otro que actuaba como modelo en una película, en la que ejecutaba una serie 
de nuevos actos agresivos, y entonces el modelo recibía castigos neutrales o re- 
compensantes, de manos de un ““maestro””. Cuando al niño después se le permi- 
tía ejecutar la misma acción, la frecuencia de respuestas agresivas que imitaban a 
las del modelo variaban directamente con el reforzamiento del modelo que se 
mostraba en la película. Sin embargo, cuando se ofrecían incentivos en una segun- 
da prueba para reproducir las conductas del modelo, las diferencias en imitación 
prácticamente desaparecían entre los sujetos expuestos a distintos modelos re- 
compensados. En apariencia, los niños habían aprendido lo mismo observando la 
conducta del modelo; ejecutaban más o menos esa conducta, dependiendo de si 
esperaban ser reforzados por ella. Aunque Skinner pue de efectuar esta distinción, 
por ejemplo, en términos de dos niveles de aprendizaje (uno acerca de las con- 
ductas y otro de control en lo que toca a las consecuencias de esa conducta), el 
hecho es que a menudo no lo hace, de modo que en sus exposiciones los concep- 
tos de aprendizaje y de ejecución están un tanto entrelazados. Otros psicólogos 
concluyen que el reforzamiento afecta más a la ejecución (mediante la motivación 
de incentivo O “recompensa anticipatoria””), que al aprendizaje. 
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Aprendizaje por observación 


Los conductistas como Skinner creen que la gente únicamente aprende res- 
puestas; es decir, sólo aquellas conductas que han ejecutado de alguna forma ma- 
niñiesta o encubierta. Los psicólogos cognoscitivistas sostienen que la información 
acerca de los eventos perceptuales se aprende mediante la observación, sin la 
verbalización o recitación implícita de palabras (u otras respuestas discriminativas) 
que se refieren a los eventos observados. ¿Cómo explican estas teorías que al- 
guien observe a un modelo hacer algo, almacene esa información, y después la use 
para guiar su ejecución posterior? Los distintos enfoques de las teorías cognosciti- 
vistas y conductistas se muestran en sus análisis acerca de la forma en que la in- 
formación perceptual se “recuerda”” durante un intervalo de retención, antes de 
que al organismo se le permita responder con base en esa información, Para consi- 
derar un ejemplo sencillo, en la "igualación a la muestra demorada”” una paloma 
en una caja de Skinner ve primero un color de muestra rojo o verde en una llave 
sobre la cual debe picotear, entonces tiene una corta demora, seguida por la ilumi- 
nación de dos llaves, una roja y la otra verde, y el reforzamiento se proporciona si 
picotea el color que se iguala al de muestra señalado antes en la prueba, Durante 
el intervalo de retención, ¿cómo '“*'recuerda”* la paloma qué color de muestra se 
presentaba? Una explicación skinneriana sería que cada color de muestra se con- 
vierte gradualmente en un estímulo discriminativo, que de inmediato hace que el 
animal despliegue dos diferentes cadenas de conductas rituales que “codifican y 
transmiten” la información discriminativa en el paso del tiempo, de modo que esté 
disponible para guiar la elección demorada (si la cadena 1 está en marcha, escoja la 
lave roja; si la cadena 2 está en marcha, elija la llave verde). Pero esta afirmación 
de cadenas mediadoras adventicias raras veces fue apoyada por la observación; 
con frecuencia el animal que discrimina tan sólo deja de hacer algo durante el inter- 
valo de demora, o al menos se comporta de modo similar durante los dos tipos de 
intervalos demorados (D'Ámato, 1973). Al parecer, el animal sólo “recuerda” el 
color de muestra como un evento central, en vez de recordarlo en su musculatura 
periférica. Así, la información de estímulo de recuerdo origina problemas al con- 
ductista, y lo mismo sucede con el aprendizaje observacional, un fenómeno que 
examinaremos en el capítulo 13, 


Las críticas de Chomsky 


Es probable que las críticas más efectivas a la posición sistemática de Skinner y 
a su extrapolación a los asuntos humanos sean las del lingiista Noam Chomsky, 
primero en su revisión crítica (Chomsky, 1959), de la obra de Skinner, Verbal 
behavior, y después en una revisión similar del libro Beyond Freedom and 
dignity (Chomsky, 1971). El Iingúista ataca a Skinner desde varios ángulos. En 
primer Jugar sostiene que el conocimiento de un sinnúmero de relaciones de 
entrada y salida (o £-R) no proporciona ninguna explicación de la conducta en nin- 
gún sentido; nuestra tarea debería consistir en comprender la estructura interna, 
los estados y la organización del dispositivo (organismo) que produce este conjun- 
to de relaciones de entrada y salida. Para Chomsky, el hecho de restringir la 
empresa teórica a los estímulos y respuestas observables equivale a imponer ca- 
denas injustificadas al desarrollo de la ciencia, y condenarla a una ““trivialidad mo- 
numental” (la descripción que hace Arthur Koestler del '*conductismo”*). **Al ob- 
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jetar a prion esta estrategia de investigación (que postula una teoría de la estructu- 
ra interna), Skinner tan sólo condena su extraña variedad de “ciencia conductual' a 
la ineptitud continua”* (Chomsky, 1971, pág. 19). Un punto de controversia en es- 
te aspecto es si la conducta ha de ser el tema de estudio de la psicología, o si sólo 
se le debe tomar como evidencia para la operación del sistema cognoscitiva. 

En segundo téfmino, Chomsky adopta las líneas de argumentos de la psicología 
cognoscitivista contra la objetividad o validez de los conceptos de Skinner acerca 
del estímulo, respuesta, reforzamiento y fuerza de la respuesta. ¿Cualesquiera y 
todos los eventos sensoriales presentes en el medio ambiente son estímulos, o 
sólo aquellos a los que el sujeto atiende y frente a los cuales reacciona? ¿Qué hace 
que dos patrones de estímulo sean equivalentes o similares? ¿Cómo puede definir- 
se, en términos objetivos, un “acto de estímulo puro mediador””? ¿Qué respues- 
tas son equivalentes? ¿No se define mejor a la respuesta como una acción dirigida 
aun lugar? ¿Cómo distinguimos topográficamente diferentes respuestas que ““sig- 
nifican”? lo mismo (por ejemplo, nombres propios versus descripciones defini- 
tivas), y por eso son casos intercambiables de una clase operante, de respues- 
tas topográficamente idénticas, que “significan'” cosas por completo distintas 
dependiendo del contexto (por ejemplo, responder '“sí”” a “¿mataste a Jorge?”* 
versus ''¿eres inocente de haber matado a Jorge?””) .De modo similar, en lo que 
respecta a Ins reforzamientos, la evidencia reciente con seres humanos (Dulany, 
1968; Estes, 19692) sugiere que los reforzamientos operan en gran parte como 
eventos informativos en lugar de hacerlo como eventos de fortalecimiento de res- 
puesta, y que un evento dado (por ejemplo, una descarga eléctrica, un soplo de 
“ire caliente) puede recibir valor de reforzamiento positivo o negativo según las 
instrucciones que se dan a la persona. Además, la investigación acerca de las con- 
ductas de comprobación de hipótesis en humanos (M. Levine, 1970) sugieren que 
los reforzadores sirven como información que confirma o refuta hipótesis comple- 
tas, que son equivalentes a toda una batería de conexiones £-R específicas. Ási- 
mismo, como se verá en el capítulo 9, cuando se revise la teoría de los reforzado- 
res, no parece haber una forma que no sea circular para identificar reforzadores 
qué sean efectivos para todos los casos y para fortalecer cualquier respuesta, 
Así, que hay dificultades con la posición de Skinner, aun en este nivel elemental. 

En tercer lugar, Chomsky critica los esfuerzos de Skinner por extrapolar sus 
conceptos a partir del dominio relativamente restringido de una “*rata en una caja 
de Skinner””, hasta los procesos y fenómenos de la vida mental y social humana. 
Sostiene que en el análisis de los términos del sentido común como querer, inten- 
te», gustar, planear y persuadir, estos conceptos se traducen de modo muy inade- 
cuado a las contingencias de tres términos sancionados por el sistema de Skinner. 
Chomsky afirma que cuando las extrapolaciones de este último se interpretan de 
forma literal (con los significados originales de los términos de laboratorio), los 
mismos son evidentemente falsos; y cuando se interpretan de la manera vaga y 
metafórica de Skinner, el análisis demuestra que son tan sólo un mal sustituto del 
uso en el sentido común. 

Siendo Chomsky un lingílista, es particularmente astuto para demostrar la 
ausencia de una referencia clara de los términos supuestamente científicos de 
Skinner cuando se discute la conducta oral. Por ejemplo, Skinner alude a las termi- 
naciones verbales (marcadores del tiempo) al afirmar que para el sujeto que habla 
el sufijo -ed de) tiempo pasado (en el idioma inglés) está bajo el control de “esa 
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propiedad sutil de los estímulos a la que nos referimos como acción en el pasado”” 
(Skinner, 1957, pág. 121), mientras que la -s en the lady walks (La señorita cami- 
na) está bajo el control de aquellas características específicas de la situación y su 
“actualidad”*, lo cual significa “tiempo presente'”. Como dice Chomsky (1959): 
“Ninguna caracterización de la noción del “control de estímulo” que esté remota- 
mente relacionada con el experimento de presionar una palanca (o que preserve la 
objetividad más débil) podrá hacerse para cubrir un conjunto de casos como éstos 
[Chomsky enumera siete u ocho] en los cuales, por ejemplo, el “estímulo de 
control” no necesite siquiera interferir con el organismo respondiente””. Chomsky 
lanza varias críticas a los ejemplos específicos de la conducta verbal analizada por 
Skinner. 

En cuarto lugar, Chomsky argumenta que el enfoque conductista del análisis del 
lenguaje debe fracasar, puesto que propone analizar sólo las llamadas caracte- 
rísticas superficiales de las expresiones orales, mientras que la mayor parte 
de las regularidades en el lenguaje se revelan únicamente cuando se extrae la 
“estructura profunda”? gramatical mediante algún analizador complejo de sintaxis 
dentro de la persona. La estructura profunda de una oración es algo así como las 
proposiciones lógicas que afirma. La misma cadena superficial de palabras puede 
tener diferentes estructuras de fondo. Así, la frase “Lo trajimos en balde” (y 
muchas frases como ésta) es gramaticalmente ambigua, ya que tiene dos posibles 
estructuras profundas, dependiendo de que “en balde"' se interprete comu “en 
vano” (expresión adverbia)) o bien como “*en cubeta” (sustantivo). Otra expre- 
sión sería **De la Rosa”, que podría interpretarse como la acción de ““dar”' (verbo) 
una rosa, como propiedad (preposición) o bien como un simple apellido compues- 
to. El análisis de la estructura profunda también es importante para revelar la simi- 
htud fundamental de un conjunto de conexiones superficiales, que de otro modo 
son muy distintas. Así, la oración en voz pasiva “*El muchacho fue mordido por la 
serpiente”” tiene una forma superficial diferente, pero la misma estructura profun- 
da que la oración en voz activa '“La serpiente mordió al muchacho”. Según 
Chomsky (1957, 1965), las dos formas superficiales se derivan, mediante dos 
transformaciones distintas, de la misma estructura profunda o proposición lógica. 
De igua) modo, la oración *'A Héctor y a Marta les gusta asistir a funerales y tam- 
bién a entierros”, se deriva mediante la sucesiya '“transformación de supresión'” 
de la proposión completa ''*A Héctor y a Marta les gusta asistir a los funerales y, 
además a Héctor y a Marta les gusta asistir a los entierros””. 

Chomsky argumenta que estas similitudes y regularidades entre las expre- 
siones orales superficiales no pueden comprenderse sin que la persona que es- 
cucha o la que habla hayan adquirido tácitamente una teoría desarrollada de la gra- 
mática que les permita ejecutar estas traducciones. Chomsky y sus colegas (Be- 
ver, 1968; Bever et al., 1968) han sustentado que las teorías del lenguaje que tra- 
tan sólo con las características observables ('*superficiales””) de la expresión oral 
no pueden proporcionar una explicación reveladora de nuestras habilidades lin- 
gúísticas (por ejemplo, para detectar ambigijedades, reconocer similitudes de for- 
mas fundamentales, generar embellecimientos recursivos de subproposiciones, 
etc.), sino que debemos postular más conceptos abstractos y asignar al sujeto que 
comprende el lenguaje una '*teoría gramatical interna”*, que sea tácita y suma- 
mente compleja. 

Éste no es el lugar para discutir esos puntos en detalle. La idea central que 
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habrá de considerarse es la naturaleza profundamente desequilibradora de los ar- 
gumentos de Chomsky contra la explicación conductista del lenguaje y, por ende 
contra la interpretación conductista de la vida mental. Chomsky fue en parte res- 
ponsable del ascenso de la psicología cognoscitivista (y de la psicolingútística) a 
una posición de importancia. En un comentario posterior a su revisión de Verba! 
behavior, Chomsky afirma: 


Al releer esta revisión después de ocho años, me parece.que cambiaría muy poco de su 
sustancia si volviera a escribirla. No conozco ningún trabajo empírico o teórico que ponga 
en duda estas conclusiones; y tampoco, que yo sepa, ha habido ningún intento de enfren- 
tar las críticas planteadas en la revisión o de demostrar que son erróneas o mal fundadas. 

Traté de hacer esta revisión no específicamente como una crítica de las especulaciones 
de Skinner acerca del lenguaje, sino como una crítica más general de la especulación con- 
ductista (ahora preferiría decir ““empirista””) en cuanto a la naturaleza de los procesos 
mentales superiores ... No veo ninguna forma de que las propuestas [de Skinner] 
puedan mejorar sustancialmente dentro del sistema general del conductismo o el neo- 
conductismo, o, más ampliamente, de las ideas empiristas que han dominado gran parte 
de la lingúlística, la psicología y la filosofía modernas. La conclusión que yo esperaba es- 
tablecer en la revisión era que el punto de vista general es en gran parte una mitología, y 
que su gran aceptación no es el resultado del apoyo empírico, el razonamiento convin- 
cente o la ausencia de una alternativa plausible (1967, pág. 142). 


Aunque MacCorguodale (1969, 1970) intentó más tarde responder a las críticas 
de Chomsky, las respuestas no fueron convincentes ni efectivas; además, hace 
mucho tiempo que la corriente en la psicolingilística cambió hacia un enfoque 
cognoscitivo-mecanicista, para teorizar acerca de la competencia y la ejecución lin- 
gúísticas, Hoy en día es una trivialidad afirmar que la psicolingúística experimental 
es una rama de la lingúística y de la psicología cognoscitiva, no una extensión de 
las teorías conductistas del aprendizaje (véase Clark y Clark, 1978, para una expo- 
sición representativa de la psicolingúística). 


El choque con los puntos de vista tradicionales 


Al enfoque de Skinner de ““nuevo comienzo” de la psicología se le ha dificultado 
emplear los datos recabados por otros investigadores ajenos al campo del condi- 
cionamiento operante, y rechaza en principio los tipos de constructos teóricos a 
los que son propensos otros teóricos del aprendizaje. Skinner y sus seguidores no 
han sentido la responsabilidad de coordinar estrechamente su trabajo con el de 
otros científicos dedicados al estudio del aprendizaje (y por desgracia la indiferen- 
cia a menudo es mutua), Por ejemplo, en su obra más sistemática, Science and hu- 
man behavior (1953), Skinner no hace ninguna cita bibliográfica ni de aquellos 
autores con cierta importancia dentro de la teoría del aprendizaje, sólo menciona a 
Thorndike, Pavloy, y Freud en virtud de su renombre. En sus obras raras veces 
se refiere al trabajo experimental de otros científicos, y ciertamente a ninguno 
realizado fuera de la metodología del condicionamiento operante. 

Este aislamiento continúa en las páginas del Journal of Experrmental Analysis 
of Behavior (EAB), que es en esencia el vocero del movimiento del condiciona- 
miento operante. Como un índice de la bibliografía que se ha tenido en cuenta, el 
análisis de los artículos citados en la del /EAB muestra que alrededor de un 40% 
corresponde a trabajos publicados con anterioridad en el mismo /EAB, mientras 
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que una revista especializada comparable al Journal of Verbal Learning and Verbal 
Behavior, mostraba menos de un 20% de citas propias (Krantz, 1971). Además, 
las citas provenientes de los artículos del /EAB publicadas en otras revistas dedi- 
cadas a los análisis del condicionamiento y del aprendizaje, disminuyeron durante 
los años sometidos a encuestas. Esto tiende a crear dos “*escuelas”” o campos 
aislados: los condicionadores operantes contra el resto de los psicólogos del 
aprendizaje, que van por caminos separados e independientes. 

¿A qué se debe este aislamiento y, en particular, el rechazo del resto de los psi- 
cólogos hacia el condicionamiento operante? Krantz (1971) ha señalado que los 
dos campos están separados por metodologías experimentales sumamente dis- 
tintas. Los skinnerianos (Sidman, 1960) argumentan que el diseño experimental 
tradicional (en los estudios del aprendizaje) que usa datos ensayo por ensayo pro- 
mediados en el transcurso de los ensayos y con diferentes sujetos, “destruye. 
confunde u omite los datos significativos de los cambios en la tasa de momento a 
momento en la conducta de un solo organismo” (Krantz, 1971, pág. 52). En el diseño 
experimental convencional, un solo sujeto ejecuta generalmente unos cuantos en- 
sayos de aprendizaje en una sola condición; como vimos en una sección anterior, 
en el condicionamiento operante, un sujeto puede recibir miles de “ensayos” en 
cualquier condición experimental (para alcanzar la “conducta de estado estable”, 
como dicen ellos), antes de cambiar a otro valor de una variable programada o a 
una condición experimental diferente donde recibirá de nuevo miles de ensayos. 
A un sujeto se le puede entonces ciclar sucesivamente a través de casi todos los 
valores de la variable independiente (por ejemplo, longitud media de tal variable, y 
su conducta sucesiva de estado estable ““trazaría”” la relación funcional como exis- 
te para él. Pero el diseño convencional utilizaría diferentes sujetos en los distintos 
valores: el llamado diseño “entre sujetos'”. 

La discrepancia en los procedimientos es muy evidente en las estadísticas 
(Krantz, 1971) acerca del uso relativo de los diseños entre sujetos versus los dise- 
ños intrasujeto en el JEAB y en el Journal of Comparative and Physiologica! Psy- 
chology (CPP); en los años 1967 y 1969, sólo alrededor del 3% de los artículos 
del JEAB usaron un diseño entre sujetos; mientras que el 89% de los estudios del 
JCPP lo utilizaron. Por otra parte, sólo el 6% de los estudios JCPP emplearon 
exclusivamente un diseño intrasujeto, en tanto que alrededor del 90% de los 
artículos de la JEAB lo usaban. (Estos porcentajes no suman 100 debido a los di- 
seños combinados.) 

Sidman (1960, pág. 53 y sigts.) cree que estas dos estrategias de diseño son inade- 
cuadas. La clave para usar el diseño intrasujeto es la seversibilidad de un fenómeno 
conductual, en particular la conducta de estado estable. Reversibilidad significa 
que una conducta particular de estado estable, bajo contingencias especificadas, 
Puede recuperarse una y otra vez después de que al sujeto se le ha cambiado ten+ 
poralmente a otras condiciones, y entonces regresa a las contingencias originales. 
Otros psicólogos pueden huir de los diseños intrasujeto debido a los efectos gene- 
rales de ““transferencia””, al sospechar que la conducta de un sujeto en una condi- 
ción depende de condiciones anteriores experimentadas y del orden de las mis- 
mas. La observación usual es que la ejecución en los parámetros programados, 
después se ““confunde”” por los efectos generales de transferencia, con influen- 
dias concomitantes desconocidas. 

Sidman replica que tales efectos de transferencia sun raros en los experimentos 
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de estado estable y que, si existen, constituyen importantes objetos de estudio. 
La irreversibilidad o transferencia de una a otra condición de aprendizaje no puede 
evadirse al correr grupos independientes en los valores separados de la variable 
independiente y trazarlos en una curva por vía del promedio del grupo. Como dice 
Sidman: 


-.. La función así obtenida no representa un proceso conductual. El uso de grupos 
separados destruye la continuidad de causa y efecto que caracteriza a un proceso con- 
ductual irreversible. 

Si resulta imposible obtener una relación '*no contarminada'” en un solo sujeto (debido a 
las interacciones), puede ser que la relación '“pura”* sencillamente no existe. La solución 
a nuestro problema consiste en abandonar los intentos de descubrir esa relación pura, y 
dirigir nuestra investigación hacia el estudio de la conducta tal como existe en verdad. 

+. . Cuando se encuentra el carácter irreversible, no hay ninguna curva individual que 
responda las preguntas que uno puede plantearle a la curva de grupa o viceversa. El es- 
tudiante no deberá creer que el tipo de experimento grupal proporcione de algún modo 
un sustituto más adecuadamente controlado o más generalizable para los datos indivi- 
duales. 

Si mi criterio es certero, deberá conducir al estudiante a una nueva evaluación de gran 
parte de los datos supuestamente sistemáticos de la psicología experimental... Cuando 
se proceda así, es posible que el estudiante descubra que tiene que abandonar muchas de las 
generalizaciones populares de la psicología. También es probable que se enfrente a una 
elección, pues ambos tipos de datos representan, en un sentido real, diferentes temas 
de estudio (pág. 53). 


Como se advierte, la división entre las dos metodologías depende del foco de in- 
terés; en particular, de si la conducta de transición (y transitoria) es de interés 
central, como cuando el animal adquiere una nueva habilidad o extingue un antiguo 
hábito; o si la conducta asintótica de estado estable es o no de interés fundamen- 
tal. Las antiguas teorías del aprendizaje tendían a centrarse en la adquisición y en 
la tasa de ésta, mientras que los condicionadores operantes se preocupan más por 
la conducta de estado estable mantenida por contingencias dadas. Su metodología 
se asemeja en mucho a la del psicofísico, que somete a prueba repetidas veces a 
un sujeto. Diseños similares de miles de ensayos son ahora comunes en los estu- 
dios de la memoria humana (por ejemplo, Atkinson y Shiffrin, 1965) y del procesa- 
miento de la información (Sternberg, 1969). Por lo tanto, no hay razón para la se- 
paración metodológica de estos campos. 

La división principal es la que marca una preferencia teórica o, mejor dicho, una 
predilección por teorizar en un lado versus la falta de simpatía por los esfuerzos 
teóricos, del otro lado, El problema se reduce a decidir cuáles son las metas apro- 
pladas de una psicología científica. Y aquí retornamos al cisma del empirismo y el 
racionalismo en la antigivedad (véase el capítulo 1). Hay una oposición fundamental 
entre los científicos que creen que el progreso se logra sólo mediante el examen 
riguroso de la conducta real resultante en la formulación de unas cuantas generali- 
zaciones, y aquellos que afirman que las observaciones conductuales son intere- 
santes mientras revelen leyes fundamentales de la mente, que sólo se muestran 
de forma parcial en la conducta. La psicología ¿será la ciencia de la mente a la cien- 
cia de la conducta? ¿Es la física la ciencia de las cosas materiales o la ciencia de la 
lectura de mediciones? ¿Tiene la ciencia el propósito de comprender la forma en 
que funcionan las cosas o la manera de controlar su funcionamiento? ¿Es la 
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astronomía algo menos que una ciencia porque los astrónomos no pueden experi- 
mentar con los cuerpos celestes mi controlarlos? ¿Acaso los conductistas confun- 
den el objeto de estudio con la evidencia disponible para obtener inferencias acer- 
ca de ese objeto de estudio? Skinner opta por la conducta como tema de estudio; 
los psicólogos cognoscitivistas que integran la oposición actual (por ejemplo, Neis- 
ser, 1967; Rumelhart, 1978) suponen que usamos la conducta como evidencia para 
la operación de los procesos cognoscitivos. Este enfrentamiento contemporáneo 
de opiniones ilustra lo fundamentales que son estas premisas esencialmente his- 
tóricas y filosóficas. 


LECTURAS COMPLEMENTARIAS 


Los libros siguientes comprenden las propias relaciones de Skinner sobre su trabajo: 

Ferster, C. B. y Skinner, B. F., Scheduies of reinforcement, 1957. 

Molland, J. G. y Skinner, B. F., The analysis of behavior: A program for self. instruction, 
1961. 

Skinner, B. F., The dehavior oforganisms, 1938. 

Skinner, B. F., Science end human behavior, 1953. 

Skinner, B. F., Verbal behavior, 1957. 

Skinner, B. F., The technology of teaching, 1968. 

Skinner, B. F., Contingencies of reinforcement, 1969, 

Skinner, B. F., Beyond freedom and dignity, 1971. 

Skinner, B. F.. About behaviorism, 1974. 


Está disponible una recopilación de los artículos teóricos y éxperimentales, elegidos por el 
mismo Skinner como los más representativos de sus contribuciones, en: 


Skinner, B. F., Cumulativezecord, 1972. 


Una valoración retrospectiva acerca del trabajo de Skinner, junto con material autobiográ- 
fico: 


Dews, P. B., Festschnifi for B. F. Skinner, 1970. 


Los dos volúmenes autobiográficos de Skinner son Particulars of my life (1976) y The sha- 
ping of a beharionst (1979). 

Es de gran importancia leer la novela Walden two de Skinner (19484) junto con Science 
end human behavior (1953), a fin de comparar el sistema científico y su aplicación imaginaria 
en una utopía experimental. Skinner propone su Beyond freedom and dignity (1971) para la 
aplicación de la “"tecnología de la conducta”” de los enfermos de la sociedad; este libro tuvo 
una recepción muy controvertida entre los intelectuales y los críticos sociales. Las implica- 
ciones éticas de los análisis de Skinner acerca del libre albedrío, la modificación de la conduc- 
ta y el control social, son el tema del libro escrito por F. Carpenter, The Skinner primer: 
Behind freedom and dignity (1974). 

Con respecto a las posiciones metodológicas de Skinner, consúltese el libro de M. Sid- 
man, Tactics uf scientific research (1960). Como ejemplo de las diferentes aplicaciones de la 
teoría de Skinner, una fuente útil es Operani behavior: Areas of research and application de 
W. K. Honig (dir.) (1966). Véanse también: 


Honig. W. K. y Staddon, J. E. R. (dirs.), Handbook of operant behavior, 1977. 
Verhave, T. (dir.), The experimental analysis of behavior: Selected readings, 1966. 
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Teoría del muestreo 
del estímulo, 
de Estes 


La introducción del método experimental en el estudio del aprendizaje durante 
el siglo xIX estableció una tradición de métodos cuantitativos para el registro, el 
procesamiento y la descripción de los datos conductuales. Las tendencias de res- 
puesta comúnmente se medían de acuerdo con su amplitud, latencia de respuesta 
o frecuencia relativa de ocurrencia. A mediados de la década de los cincuenta sur- 
gjó una tendencia a enmarcar las hipótesis acerca del aprendizaje, que se basa en 
los detalles cuantitativos de los datos conductuales. Estos modelos matemáticos 
del aprendizaje intentan predecir los detalles numéricos exactos de los resultados 
experimentales, Los escritos y el trabajo teórico de Clark Hull imprimieron un 
gran impulso a esta tendencia. Hull abogaba en favor del desarrollo de teorías 
cuantitativas en el aprendizaje, su propio trabajo en este aspecto era en esencia 
programático y dio lugar a varias predicciones genuinamente cuantitativas a partir 
de datos numéricos. Sin embargo, el tipo de programa que Hull pedía apareció de 
forma significativa después de 1950, con el nombre de teoría matemática del 
aprendizaje. William K. Estes, cuyo trabajo reseñamos aquí, fue un líder en este 
campo. Sus primeros desarrollos aparecieron en la obra Handbook of mathemati- 
cal psychology (Luce et al., 1963, 1965), y en un libro de texto, Introduction to 
mathematical learning theory (Atkinson et al., 1965). 

Un punto central que debemos destacar desde el comienzo es que en realidad 
no existe tal teoría matemática del aprendizaje. Este término designa un tipo parti- 
cular de enfoque de la construcción de la teoría en lugar de aludir a un conjunto 
aislado y específico de postulados que pudieran denominarse apropiadamente 
teoría. Los recursos de las matemáticas están a disposición de los teóricos de to- 
das las orientaciones. Las fórmulas que intervienen son indiferentes al contenido 
de las ideas psicológicas que expresen, es decir, en términos matemáticos pueden 
analizarse y establecerse una diversidad de hipótesis sustantivas acerca del apren- 
dizaje y de la conducta. Como campo, la teoría matemática del aprendizaje está 
ocupada por un vago conjunto de estudiosos con diferentes ideas, cuyo único 
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vínculo común es el uso de las matemáticas como vehículo para la enunciación pre- 
cisa y la comprobación de sus hipótesis al compararlas con los datos. 

En general, el trabajo en la teoría matemática del aprendizaje ha girado en torno 
de las situaciones experimentales explotadas por Hull, Skinner y la tradición fun- 
cionalista; es decir, el condicionamiento clásico e instrumental, el aprendizaje se- 
lectivo, y ha puesto un mayor acento en el aprendizaje humano en condiciones de 
laboratorio, Asimismo, gran parte del trabajo teórico se ha llevado a cabo básica- 
mente en la vena del asociacionismo de estírmio y respuesta. Sin embargo, esta 
situación refleja principalmente los fundamentos y las predilecciones de quienes 
prefieren trabajar con el lenguaje matemático, ya que las hipótesis cognoscitivistas 
pueden representarse y lo han hecho de forma matemática. 

En tugar de revisar la teoría matemática del aprendizaje en su totalidad, este 
capítulo se concentra en el trabajo de un hombre, William K. Estes, que ha sido 
líder en este campo desde 1950. Enunció una forma de teoría matemática del 
aprendizaje denominada teoría del muestreo del estimulo. Este trabajo continuo, el 
más extenso y coherente en su campo, sirve de ejemplo prototípico de una teoría 
matemática del aprendizaje, y por ello merece un tratamiento especial. 


ANTECEDENTES DE LA TEORÍA 
DEL MUESTREO DEL ESTÍMULO 


La teoría del muestreo del estímulo (TME) comenzó como una forma de aso- 
diacionismo del estímulo y la respuesta, cuando Estes intentó formalizar muchas 
de la ideas de Guthrie. La idea básica es que los organismos aprenden al vincular 
nuevas conductas adaptativas a situaciones de estímulo en las que anteriormente 
tenían una conducta en gran medida inapropiada. Las condiciones del reforzamien- 
to definen lo que es adaptativo en una situación dada. Estes aceptaba la ley empírica 
del efecto, según la cual los reforzadores fortalecen y guían la conducta, aunque no 
creía que las recompensas operen al proporcionar “satisfacción” o “*reducción del 
impulso** después de una respuesta correcta. En sus artículos iniciales, en la dé- 
cada de los cincuenta, Estes se inclinaba por una interpretación guthriana del re- 
forzamiento; es decir, los reforzadores eran estímulos que de algún modo asegu- 
raban que la respuesta correcta fuese la última en ocurrir ante los estímulos 
críticos en un ensayo determinado. Más adelante, Estes cambió a la creencia de 
que los organismos aprendían representaciones internas para eventos externos y 
secuencias de eventos, así como que entre estas representaciones de eventos se 
formaban asociaciones. El ““evento*” en cuestión puede ser un estímulo (E), una 
respuesta (R) o una consecuencia reforzante (C). De acuerdo con esta opinión, un 
organismo que experimente una secuencia X-R-C aprenderá asociaciones para 
todos los pares de elementos, X-R, R-C y E-C. Anteriormente, en ocasión de exa- 
minar las revisiones de Estes de la ley del efecto, ilustramos la manera en que in- 
teractúan estas asociaciones a fin de permitir al organismo seleccionar una res- 
puesta adaptativa. En general, la conexión de estímulo y respuesta proporciona 
retroalimentación '“buena'* o *“mala””, que facilita o inhibe una conexión específica 
de estímulo y respuesta. Pero estamos alejándonos del tema. Para la mayor parte 
de los desarrollos matemáticos de la teoría del muestreo del estímulo, no hay dife- 
rencia en la interpretación que se haga de la le y empírica del efecto. 
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El punto de vista estadístico de la ejecución 


La teoría del muestreo del estímulo trata explícitamente al aprendizaje y a la eje- 
cución como procesos probabilísticos (o estocásticos). Un proceso estocástico es 
sencillamente una secuencia de eventos susceptibles de analizarse en términos de 
probabilidad. Como ejemplos familiares puede mencionarse la secuencia de actos 
de arrojar una moneda o de tirar un dado. En un experimento de aprendizaje (por 
ejemplo, una rata que aprende a girar a la izquierda en un laberinto en forma de TD), 
la secuencia de sus respuestas izquierda o derecha durante sucesivos ensayos 
puede considerarse como un proceso probabilístico. Piénsese en ello como una 
secuencia de tirar monedas, con la excepción de que, debido al aprendizaje, la mo- 
neda se vuelve cada vez más propensa a caer en el lado “*correcto'”. Nuestra rata 
en el laberinto 7 producirá, en el transcurso de los ensayos, una secuencia de 
respuestas correctas (C) y equivocadas (E), como ECEECECCC ... (todas las 
restantes son C). Tendríamos una secuencia así para cada uno de nuestros N su- 
jetos en el experimento, y cada uno de ellos diferirá de todos los demás. Vista de 
esta forma microscópica, existe una variabilidad impresionante dentro de las res- 
puestas de un animal de ensayo a ensayo, así como entre los propios animales. Si 
la conducta se determina causalmente, ¿cómo explicar toda esta variabilidad? El 
enfoque determinista sostiene que, en realidad, los animales se diferencian en su 
estructura genética y en sus historias previas, y que estos factores determinan las 
elecciones y la sensibilidad de cada uno de ellos al reforzamiento. El comporta- 
miento variable que muestra un animal en los ensayos se explicaría al postular va- 
riación en la situación de estímulo externo, en la atención momentánea del animal 
a ciertos estímulos, a fluctuaciones en Su motivación, a variaciones en su entrada 
de recuerdos relevantes, etcétera. El determinista argumenta que si conociéramos 
la totalidad de dichas causas en el momento en que el animal hace la eleccián, ésta 
parecería ser completamente determinada y, por ende, predecible. 

Sin embargo, un enfoque alternativo presupone que como la conducta es deter- 
minada por muchísimas variables y causas que no pueden medirse, la mejor pre- 
dicción de la conducta que podemos ofrecer en la práctica es una probabilística. En 
vez de decir *“el sujeto girará a la izquierda en este ensayo”, decimos “hay un 
80% de probabilidades de que gire a la izquierda”. Eso equivale a afirmar en el ca- 
so de arrojar una moneda que hay un 50% de probabilidades de que caiga en cual- 
quiera de ambas caras. Así, podemos caracterizar nuestra predicción de lo que va 
a suceder para un sujeto al estipular, para cada ensayo, la probabilidad de que 
ocurra cada una de las diversas respuestas. 

La principal variable dependiente de la teoría matemática del aprendizaje es la 
probabilidad de varias respuestas de un sujeto en cualquier punto del tiempo, dada 
su historia particular de aprendizaje. Para nuestro ejemplo del laberinto 7, en 
tearía dejaríamos que P,, PD, y 3... representen la probabilidad de que el sujeto 
dé una respuesta correcta en el ensayo 1, en el ensayo 2, en el ensayo 3, etcéte- 
ra. El subíndice en $, designa al número de ensayo, n. Sin embargo, a diferencia 
de una serie de lanzamientos de moneda, en un experimento de aprendizaje la se- 
cuencia de ensayo de probabilidades cambia; de hecho, la probabilidad de una res- 
puesta correcta debería incrementarse en el curso de los ensayos hasta alrededor 
de 1.00. Los primeros cinco ensayos de un hipotético experimento de aprendizaje 
se describen en la tabla 8.1. 
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TABLA 8.1. Los primeros cinco ensayos de un hipotético experimento de 
aprendizaje. Las respuestas correctas o erróneas se han generado en 
una hilera para cada sujeto mediante la comparación de nuevos 
números aleatorios con la probabilidad teórica de una respuesta 
correcta durante los cinco ensayos. 


Ensayos 1 2 3 4 5 
Probabilidad (o) (63) (py) (on (os) 
teórica de € 0:50 0.60 0.65 0.70 0.75 

Suj.1 E Cc C E E 
Saj. 2 Cc E C Cc €. 
Suj. 3 13 E Cc Cc Cc 
Suj. 4 c Cc E Cc € 


Una teoría del aprendizaje como la del muestreo del estímulo describe los even- 
tos efectivos que promueven el aprendizaje. Si una teoría es lo bastante explícita y 
simple en su aplicación a una situación dada de aprendizaje, nos permite de- 
sarrollar un modelo matemático para describir los cambios en la conducta del suje- 
to en el transcurso de los ensayos de aprendizaje. Un modela estadístico del 
aprendizaje consiste en premisas acerca de la manera en que la probabilidad de que 
una respuesta correcta del sujeto cambie de ensayo a ensaya, como resultado de 
las consecuencias que experimenta en cada uno de ellos, Dada esta representa- 
ción del aprendizaje y la ejecución como una secuencia por ensayo de probabilida- 
des de respuesta, el teórico puede predecir cualquiera entre un gran número de 
estadísticos descriptivos de los datos del sujeto como sus errores totales, su en- 
sayo del último error (antes de una carrera de ejecución sín error), etcétera. La 
cuestión de inferir predicciones para tales estadísticos a partir de un modelo 
estadístico, consiste únicamente en un trabajo matemático dentro del cálculo de 
probabilidades, que por sí solo carece de contenido o significado psicológicos. 

La variabilidad en la ejecución entre diferentes sujetos puede tratarse de diver- 
sas formas. Una es presuponer que los sujetas realmente difieren en la tasa de 
aprendizaje y en las tendencias iniciales de respuesta, y por eso los aspectos del 
modelo matemático se estiman y se adecuan separadamente para cada individuo. 
Un enfoque mucho más conveniente consiste en presuponer que dentro de una si- 
tuación experimental determinada, las verdaderas diferencias individuales son in- 
significantes, y que la variabilidad entre diversos sujetos es sólo la que cabría es- 
perar, por lo general, en distintas muestras de una secuencia común de probabili- 
dades. Como ilustración, examínese la tabla 8.1, donde se han generado cuatro di- 
ferentes secuencias ('“sujetos'” hipotéticos, uno en cada hilera). Esto se hizo con 
la ayuda de una tabla de números aleatorios y decisiones para cada sujeto y-para 
cada ensayo, en el que el sujeto daba una respuesta correcta si el siguiente núme- 
ro aleatorio de dos dígitos era menor que el valor p en ese ensayo. Por ejem- 
plo, en el ensayo 2 el valor de p, es 0.60: el primer número aleatorio encontrado 
para ese ensayo era 37, que es menor de 60, de modo que se pone una C para el 
sujeto 1 en el ensayo 2; en el segundo número aleatorio era 83, el tercero, 71, 
y el cuarto 53, que conducían a decisiones de respuestas E, E y C para los su- 
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jetos 2, 3, 4 en el ensayo 2. Las respuestas hipotéticas se determinaban de modo 
similar en los ensayos 3, 4, 5. 

El examen de las secuencias de los cuatro sujetos sugiere grandes diferencias, 
Si fuéramos propensos a sacar conclusiones, diríamos que los sujetos 2 y 4 son 
aprendices rápidos, que el sujeto 1 es un aprendiz lento, que el 3 parece haber 
obtenido la conducta correcta repentinamente, después de un mal comienzo, etcéte- 
ra. Pero éstas sólo son ficciones supersticiosas dentro de nosotros, los observado- 
res, ya que en realidad sabemos que las respuestas de los cuatro sujetos se gene- 
raron a partir de las mismas probabilidades fundamentales. (Con más ensayos, la 
variabilidad entre sujetos parece incluso más extrema.) Así, la premisa de las pro- 
babilidades comunes de respuesta todavía genera mucha variabilidad entre las 
muestras ('“sujetos””), Por consiguiente, no debería concluirse que aquí hay dife- 
rencias individuales reales, a no ser que existan divergencias muy notables, En la 
práctica, este hecho ha permitido al teórico del aprendizaje matemático combinar 
los datos de un grupo homogéneo de aprendices, al presuponer que tan sólo son 
distintas muestras de un proceso subyacente de probabilidad común; entonces el 
teórico intenta aplicar el modelo matemático para predecir aspectos de los datos 
combinados. Desde luego, el modelo podría ajustarse a los datos de cada sujeto 
por separado, pero eso significa mucho más trabajo y es considerablemente me- 
nos impresionante, ya que deben estimarse demasiados parámetros de modelo 
desconocidos. 

Con estas consideraciones como información básica acerca del enfoque estocás- 
tico del aprendizaje, veremos la sustancia de la teoría del muestreo del estímulo. 


PREMISAS FUNDAMENTALES DE LA TEORÍA 
DEL MUESTREO DEL ESTÍMULO 


La representación de la situación de estímulo 


Corno hemos dicho, la T.M.E es una formalización del enfoque de Guthrie del 
asociacionismo de estímulo y respuesta. La situación de estímulo se representa 
como una población de componentes o aspectos independientemente variables de la 
totalidad del ambiente, denominados elementos de estímulo. En cualquier momento 
de un ensayo experimental, sólo una muestra de elementos de la población total es 
activa o efectiva. Mientras menos variables sean las condiciones experimentales, 
menos Variables serán las muestras de ensayo sucesivo de los elementos de 
estímulo. 

Pueden identificarse dos fuentes de variación aleatoria en la estimulación: la pri- 
mera surge de los cambios incidentales en el ambiente durante el experimento 
(ruidos extraños, fluctuaciones de temperatura, olores dispersos, etc.); y la segunda 
brota de los cambios en el sujeto, ya sea por una alteraciónen la orientación de sus re- 
ceptores (lo que mira o escucha), de modificaciones en su postura o estímulos pro- 
ducidos por la respuesta, o de fluctuaciones en su sistema de transmisión senso- 
rial. Cuando a los sujetos humanos se les presentan estímulos verbales, la variabi- 
Udad puede ocurrir debido a diferentes asociaciones o interpretaciones implícitas 
excitadas por el material en distintas ocasiones (Bower, 1972d). No existe ningún 
compromiso con alguna cantidad fija de tal variabilidad de estímulo; la teoría habrá 
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de estimarla. Así, en las situaciones simples de aprendizaje, en las cuales el expe- 
rimentador aplica el mismo estímulo (por ejemplo, el tañer de una campana) al co- 
mienzo de cada ensayo, esto se representa sólo como una población potencia! de 
los elementales de estímulo N. 

En cada ensayo, sólo una muestra de los elementos N serán activos o efectivos. 
En la figura 8.1 se ilustra la extracción de una muestra de ensayo de elementos de 
estímulo, Si pensamos en los elementos de estímulo corao N bolitas en una caja, 
son factibles varios esquemas-de muestreo, pero en las discusiones teóricas se 
han empleado con mayor frecuencia dos esquemas simples. Uno presupone que 
cada elemento de estímulo tiene una probabilidad £ de entrar en la muestra, inde- 
pendientemente de cuántos elementos más se incluyen en ella. Según este es- 
quema, el número de elementos en la muestra variará aleatoriamente de un ensa- 
yo al siguiente, y el tamaño promedio de la muestra consistirá en NO elementos. El 
segundo esquema presupone que un número fijo de elementos se extrae aleato- 
riamente, sin reemplazos de los elementos N de la población. Si dejamos que s 
represente al tamaño fjo de la muestra, entonces cada elemento tiene una proba- 
bilidad general de s/N de aparecer en la misma. Los modelos especiales obtenidos 
cuando se presupone que s = 1 se denominan modelos de patrón. Se les ha inves- 
tigado mucho, y serán, examinados más adelante. 


Conexiones de respuesta y el estado del sistema 


Ya hemos visto cómo se representa la situación de estímulo y la muestra del en- 
sayo. Para hacer contacto con la ejecución, la teoría presupone que cada ele mento 
de estímulo está condicionado (conectado) a una respuesta. Las alternativas de 
respuesta se designan con los subíndices A, y Az. En un experimento de doble elec- 
ción, por ejemplo, algunos elementos estarían conectados con la alternativa de 
respuesta A, y algunos con la otra opción, A,; en una situación de operante libre, 
A, podría consistir en '*presionar la palanca” y Az designaría cuaiquier conducta 


Pobjación potencial 


Muestra activada 
en el ensayo 


Figura 8.1. Ilustración del proceso de extracción de una muestra aleatoria de elemen- 
tos de estimulo (círculos pequeños) para que sean activos en un ensayo dado. La po- 
blación potencial contiene 14 elementos, y la muestra 4, de modo que 0 es 4/14, 0 0.29 
El rótulo 1 o 2 en cada elemento indica si está asociado con la respuesta A, o con la. 
Az al comienzo del ensayo, En la población, la proporción de elementos conectados 
con A, es de 6/14 o 0.43. 
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que no fuera ésa. Se supone que la conexión condicional entre un solo elemento de 
estímulo y una respuesta es unitaria y de fuerza máxima, sin variar en grado. Se- 
gún este enfoque, podemos caracterizar las disposiciones del sujeto en cualquier 
momento de nuestra situación al enumerar los diversos elementos de estímulo, y 
la respuesta pertinente asociada en el momento con cada elemento. Esa lista es el 
estado del sistema teórico al caracterizar a un individuo en ese momento. En el 
transcurso del aprendizaje, los elementos cambiarán sus asociaciones para este 
sujeto; diríamos que el estado del sistema cambia de ensayo a ensayo, alternativa- 
mente. 

Como las probabilidades de las diversas respuestas dependen del estado del sis- 
tema, tenemos que calcular ese estado a medida que avanzan los ensayos. ¿Pode- 
mos encontrar una forma útil de representar el estado del sistema, de modo que 
estos cálculos se simplifiquen? Indudablemente que sí, y la razón es que los es- 
quemas de muestreo mencionados asignan a cada elemento una probabilidad ¿gral 
de muestreo. Debido a esta premisa, no necesitamos saber qué elementos están 
asociados con qué respuestas a fin de predecir la probabilidad de la respuesta. To- 
do lo que en verdad necesitamos saber es qué proporción de los elementos de es- 
tímulo está asociada con cada respuesta. Por ejemplo, en un experimento de 
dos respuestas, dejaríamos que ) designara la proporción de elementos asociados 
con la respuesta A, , y 1 — ) denotaría la proporción restante de elementos aso- 
ciados con la respuesta 4, . En este caso, nuestra descripción del estado del siste- 
ma se reduce al número único, $. Y los cálculos de este solo número son conside- 
rablemente más fáciles de seguir que los cálculos de la enumeración cambiante de 
asociaciones para todos los elementos. 


Reglas de ejecución y de reforzamiento 


La ejecución en cada ensayo se determina por los elementos que se experimen- 
tan, o *'se muestrean”, en ese ensayo. Se presupone que la probabilidad de cual- 
quier respuesta es igual a la proporción de elementos muestreados en ese ensayo, 
que están conectados con dicha respuesta. Si una muestra de tamaño 10 contiene 
5 elementos conectados con A, 3 con Ay, y 2 con Ay, entonces las probabilidades 
son 0.5, 0.3 y 0.2, respectivamente, si la respuesta es A,, A20 Ay. Si el número 
de elementos es amplio y, por lo mismo, resulta aplicable la ley estadística de los 
grandes números, la regla de ejecución tiene el efecto de establecer la probabili- 
dad de que la respuesta A, sea igual a p, la proporción de las elementos conecta- 
dos con A, en la población. Por lo general, se supone que éste es el caso. 

Una vez que ha extraído una muestra de estímulo y que ha respondido, el sujeto 
recibe alguna consecuencia reforzante. Son estas consecuencias las que cambian 
las conexiones condicionales de los elementos muestreados en un ensayo, con lo 
cual alteran el estado del sistema. En teoría, si se han identificado r clases de res- 
puestas, entonces se definen 7 + 1 eventos teóricos reforzantes, designados co- 
mo Ey, E,, E,,... E.. Se supone que exactamente uno de estos eventos reforzan- 
tes ocurre en la terminación del ensayo. Los eventos E, E,,.. . E, se refieren al 
reforzamiento de las respuestas Ay, Aj, ..-. 4, respectivamente, mientras que E, 
señala que ninguna de las respuestas fue reforzada, Si un ensayo termina con el 
evento reforzante E,, todos los elementos muestreados en ese ensayo se condi- 
cionan a la respuesta A,, si es que ya no lo estaban. Por ejemplo, si un elemento 
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conectado con 4,, se muestrea en un ensayo cuando ocurre el reforzamiento Ej, 
este elemento cambia su conexión condicional de A, a A, de una manera de todo 
o nada. Por último, E, designa un evento nulo; la ocurrencia de E, significa que 
ninguna de las respuestas fue reforzada, de modo que no se produce ningún cambio 
en las conexiones condicionadas de los elementos muestreados. 

Es necesario incluir algunas otras consideraciones acerca de estas premisas de 
condicionamiento. En primer lugar, estos axiomas describen cambios en las cone- 
xiones de los elementos de estímulo en el transcurso de los ensayos, y se conside- 
ra que esto es el aprendizaje, Mediante tales reglas, los sucesivos ensayos de 
práctica dan lugar a la unión de la respuesta recompensada, o “correcta”, con un 
número cada vez mayor de elementos de estimulo muestreados de la población, lo 
cual ocurre a costa de desunir las respuestas '“erróneas'' de estos mismos ele- 
mentos. Veamos la descripción exacta del proceso. El condicionamiento de la res- 
puesta A, se logra a expensas de remover las asociaciones de las respuestas alter- 
nativas, y no se necesitan postulados especiales acerca de la extinción. Ésta se 
lleva a cabo por interferencia, en el sentido de que la probabilidad de alguna respues- 
ta de referencia Az declina, mientras se incrementa la probabilidad de una res- 
puesta competidora A). Segundo, siguiendo a Guthrie ubservamus que la TME 
presupone un condicionamiento de todo o nada de los elementos muestreados a la 
respuesta reforzada. En tercer lugar, esta representación de eventos reforzantes 
es teóricamente neutral. Para aplicaciones particulares, deben establecerse pre- 
misas sustantivas acerca de las relaciones entre los eventos reforzantes hipotéti- 
cos y las consecuencias reales en los ensayos; por ejemplo, recompensas alimen- 
ticias para una rata por dar vuelta a la izquierda en un laberinto en forma de 7; el 
estímulo incondicionado o Su ausencia en el condicionamiento clásico; información 
acerca de la respuesta correcta en el aprendizaje verbal, etcétera. 


Derivación de ecuaciones básicas del aprendizaje 


Se recordará que el estado del sistema está dado por las fracciones de los ele- 
mentos de estímulo condicionados a las diversas opciones de respuesta. Las pre- 
misas de las teorías nos permiten deducir la manera en que estas proporciones 
cambiarán de ensayo a ensayo, como consecuencia de los eventos reforzantes. 
Para simplificar, imaginemos que tratamos con un perro que aprende a salivar al 
sonido de un timbre; la salivación será, por tanto, nuestra respuesta A, y la no sa- 
livación nuestra respuesta Az. La población de elementos potenciales de estimulo 
correspondientes al sonido del timbre (EC) se representa por analogía en la figura 
8.2 como un recipiente lleno de bolitas blancas (42). En el ensayo 1, con el timbre, 
ocurre una muestra de cinco elementos de estímulo y ninguna salivación; entonces 
el E7 alimenticio, que obliga a que se produzca la salivación (A ,) al final del ensayo, 
lo cual conecta los elementos muestreados con la sativación, En nuestro modelo 
analógico, pintamos de negro las cinco bolitas muestreadas de ''timbre'”, para 
reflejar el cambio que sufren para conectarse a la salivación (4). Estas cinco boli- 
tas (negras) condicionadas A, se regresan al recipiente y se mezclan con las blan- 
cas, En el segundo ensayo con el EC del timbre, se saca una nueva muestra alea- 
toria de cinco elementos de estímulo, que consiste (casualmente) en una bolita 
negra (A) y cuatro blancas (A). La regla de ejecución de la teoría diría que la pro- 
babilidad de una respuesta salival condicionada a la muestra EC (timbre) en este 
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ensayo es de una entre cinco, 0 0.20. El E7 alimenticio se da al final del ensayo, lo 
cual origina la conexión de los elementos muestreados con la respuesta salival, El 
número de bolitas blancas que cambian a negras al final del ensayo 2 parece ser 4. 
La muestra de bolitas del ensayo 2 se devuelve al recipiente más grande, y las bo- 
litas se mezclan nuevamente para preparar el ensayo 3. La muestra EC en este 
ensayo tiene por casualidad tres elementos A, y dos Ay, de modo que la probabili- 
dad de una RC salival al timbre es de 3/5 0 0.60, y el El al final del ensayo da lugar 
al condicionamiento (cambio) de sólo dos elementos (blancos) a la respuesta Ay. 

Si observamos el número de elementos conectados a Á, en la población total al 
comienzo de cada ensayo en la figura 8.2, vernos que es 0, 5 y 9 para los ensayos 
1, 2 y 3, y será de 11 al comienzo del ensayo 4. Como hay 32 elementos en la 
población EC, esto significa que la proporción de elementos conectados a A, al co- 
mienzo de los cuatro ensayos es p, = 0/32, = 0, p, = 5/32 = 0.16, py = 9/32 = 
0.28, y pj = 11/32 = 0.44. Mientras el número total de elementos de estímulo 
conectados a A, se incrementa de ensayo a ensayo, la magnitud del aumento se 
vuelve cada vez menor en el transcurso de los ensayos. La curva negativamente 
acelerada es una curva del aprendizaje que aumenta de modo considerable durante 
los primeros ensayos de entrenamiento, y luego a pasos progresivamente más pe- 
queños durante ensayos posteriores. La figura 8.3 ilustra varias de esas curvas 
del aprendizaje, que comienzan en $, = 0.20, La mayor parte de las curvas 
empíricas del aprendizaje poseen esta forma negativamente acelerada. 
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Probabilidad de respuesta, p. 


Los procesos de muestreo y condicionamiento descritos en la figura 8.2 pueden 
formularse en términos matemáticos. Dejemos que p y —f designen las propor- 
ciones de elementos conectados a las respuestas A, y Az. Como éstas propor- 
ciones cambiarán en el transcurso de los ensayos, empleamos un subíndice para 
denotar el número del ensayo en cuestión. Así, p, designa la proporción de ele- 
mentos conectados a A, en el momento en que se evoca la respuesta en el ensayo 
n. Á p, también se le puede interpretar como: a) la probabilidad de que cualquier 
elemento aleatoriamente seleccionado en la población esté conectado a 4; y b) la 
probabilidad de que la respuesta en el ensayo x sea Ay. 

Supóngase que cada ensayo termina con un reforzamiento para la respuesta Aj; 
es decir, un reforzamiento E, finaliza el ensayo. Deseamos calcular p,.;, la proba- 
bilidad de que un elemento esté condicionado a A, al comienzo del siguiente ensa- 
yo, 1 + 1. Al recordar que 9 es la probabilidad de que un elemento de estímulo se 
muestree en cualquier ensayo dado, la ecuación del aprendizaje puede escribirse 
de la siguiente forma: 


Pr = (10 p, + 0. (1) 


Esta ecuación puede interpretarse término por término: con la probabilidad 1 — 
0 el elemento no está muestreado, de modo que su probabilidad de estar conecta- 
do aA, permanece igual que antes; es decir, p,. La otra opción es que con una 
probahilidad de 6 el elemento se muestrea, y el evento reforzante E, que ocuwre 
en ese ensayo condiciona el elemento a A,, con seguridad. 

Observemos algunos hechos matemáticos acerca de la ecuación 1. Primero, Pe, 
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será mayor que —o igual a— P,, de manera que un reforzamiento E, incrementa 
la probabilidad de una respuesta A,. Segundo, P,.., es una función lineal (línea rec- 
ta) de fp... De este hecho deriva el nombre de modelo lineal, que se refiere a un sis- 
tema de tales ecuaciones. Tercero, un reforzamiento E, hace aumentar a p hasta 
un límite (o asíntota) que a la postre tiende a la unidad. Es decir, cuando f, = 1, la 
ecuación 1 será P,+, = 1. Si se diera una serie consistente de sucesos E,, Corres- 
pondientes a repetidas aplicaciones de la ecuación 1, p se incrementaría desde al- 

gún valor inicial y se acercaría a una unidad asintótica. Así, la ecuación 1 implica 
que los reforzamientos consistentes E, a la larga conducirían a ocurrencias consis- 
tentes de las respuestas A,. Si se desea predecir la curva del aprendizaje, sencilla- 
mente rastreamos el efecto, ensayo por ensayo, de la aplicación de la ecuación 1, 
al valor inicia) $ a partir del cual comenzó el proceso en el ensayo 1. Para calcular 
P, para una secuencia consistente de eventos E, aplicamos reiteradas veces la 
ecuación 1. Es decir, p, se calcula de p, mediante la ecuación 1. Entonces, Py se 
calcula a partir de pz usando de nuevo la ecuación 1, y así sucesivamente, El resul- 
tado es la siguiente expresión general: 


$.=1-(1—pY) 0-9"! e) 


Esta expresión conduce a f, como una función negativamente acelerada del en- 
sayo de práctica, 4. El límite de fp, es 1, ya que la fracción 1 — O decrece hasta lle- 
gar a cero a medida que se eleva a potencias cada vez más altas. En la figura 8.3 
pueden observarse algunas gráficas de esta función. Para estas curvas, p, = 0.20 
y $ es 0.05, 0,10 y 0.20 para las tres curvas. La curva asciende con más rapidez 
para los valores más grandes que 9. Recuérdese que 8 es la probabilidad de que un 
elemento de estímulos se muestree; cuando € es baja, habrá mucha variabilidad de 
ensayo a ensayo en la composición de la muestra de estímulo; cuando 0 es alta, 
siempre estará presente la mayor parte de los elementos, de modo que una 
muestra variará muy poco en relación con las otras. En la figura 8.3 puede verse 
cómo esta variabilidad del estímulo afecta a la tasa del aprendizaje. La influencia 
demorada de la mayor variabilidad del estímulo sobre el aprendizaje fue observada 
por primera vez por Pavlov (el fenómeno de la inhibición externa). Otros experi- 
mentos realizados por Wolfle (1936), E. J. Green (1956), y Burke, Estes y Hul- 
yer (1954), proporcionan resultados que pueden interpretarse en términos de va- 
naciones 0. 


Eliminación de las respuestas de 
interferencia y extinción 


La ecuación 1 describe el aumento en la probabilidad de una respuesta A, en un 
ensayo que es reforzado. Pero, ¿qué le sucede a la probabilidad de una respuesta 
A, como resultado de este ensayo? Evidentemente, la probabilidad de una res- 
puesta 4, decrece, ya que las probabilidades de las dos respuestas deben sumar 
uno. (Debido a la manera en que se han definido las respuestas, una y sólo una 
puede ocurrir en cada ensayo experimental.) Por ejemplo, si por torcer a la iz- 
quierda en un laberinto en forma de 7 un reforzamiento incrementa la probabilidad de 
que una rata dé vuelta a la izquierda (41), entonces debe reducir su probabilidad 
de girar a la derecha (4), ya que er cada ensayo sólo da una respuesta. La teoría 
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del muestreo del estímulo aplica el mismo análisis de *“elegir una respuesta”” que a 
las RC en las situaciones de condicionamiento pavloviano e instrumental, así como 
en situaciones explícitas de elección. 

La ecuación 1 implica una segunda ecuación que describe el decremento de la 
probabilidad de una respuesta A debida a un ensayo E, cuando la respuesta 
opuesta (A,) es reforzada. De modo similar, La ecuación 2 implica otra que describe 
la probabilidad decreciente bd una respuesta A; durante una serie de ensayos re- 
forzados Ay; es decir: 


p(A) en ensayo 2) = 1 — p (A, en ensayo n) 


(1—p y 418! 65) 


”u 


De acuerdo con la ecuación 3, la probabilidad de una respuesta A, comienza en 
1— p, en el ensayo 1, y declina a cero a medida que continúa la práctica con el re- 
forzamiento Ay. Esto sucede ya que (1 — 0)""! se hace más pequeña conforme » 
aumenta. 

Si como observadores nos hemos concentrado y hemos registrado la conducta 
A, notaremos que el entrenamiento A, elimina las respuestas A) de la situación. 
Ésta es la idea de ““interferencia”” de Guthrie adoptada por Estes en la TME. la 
conexión de una respuesta con los elementos de estímulo de una situación ocurre 
sólo al desconectar todas las respuestas alternativas a esos elementos. Así, cuan- 
do decimos que estamos **condicionando” la respuesta A, a una situación en que 
antes no ocurría, también podríamos'decir que ““extinguimos””, o eliminamos to- 
das las demás respuestas que el organismo da a esa situación. Así, la ecuación 3 
puede concebirse como una curva de extinción para la respuesta Aj, y en realidad 
las curvas empíricas de extinción (véase la figura 3,2) a menudo tienen la forma 
que se describe en la ecuación 2. 

Recuérdese que para una situación de dos elecciones con respuestas Á, y Az, 
definimos E, como un reforzamiento para Ay, y Ez como un reforzamiento para 
Az. El efecto de un reforzamiento E, sobre da probabilidad de una respuesta A, se 
dio en la ecuación 1. Si reforzáramos A, en un ensayo dado, eso decrementaría la 
probabilidad de una respuesta A, mediante la siguiente fórmula: 


Pre =(1—0)p, + 0.0 = (1-9). (4) 


La interpretación de muestreo del estímulo de la ecuación 4 es la siguiente: la 
probabilidad de que un elemento de estímulo se conecte con A, al comienzo del 
ensayo 1 + 1 es exactamente la probabilidad de que estuviera conectado a A, an- 
tes del ensayo x (9,), por la probabilidad de que no estaba muestreado (1 — 8) y 
condicionado a Az en el ensayo n. Un evento reforzante E, hace disminuir a p, tal 
como un evento reforzante E, hace decrecer a 1 — p,. Si fuera a ocurrir una serie 
de reforzadores Ej, entonces p, se reduciría casi a cero.. 

Podemos agrupar nuestras ecuaciones críticas de la siguiente forma: 


(1 —0) p, + 6 siA, se refuerza 
en el ensayo » 
Pa o 
(1 — 0) p, si A, se refuerza 
en el ensayo n 
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Estas ecuaciones constituyen la médula del modelo lineal. Observamos que son 
ecuaciones diferentes, que expresan cómo una variable (P,) cambia sus valores 
desde un punto discreto en el tiempo (ensayo n) hasta el siguiente punto en el 
tiempo (ensayo a + 1). 


APLICACIÓN DE LA TME A TÓPICOS SELECTOS 


Respuestas a compuestos de estímulo 


Una pregunta usual es si podemos predecir las probabilidades de diversas res- 
puestas a un compuesto de varios estímulos, al conocer la forma en que los ele- 
mentos individuales del compuesto se conectan con las respuestas. Si un conjunto 
de elementos S, está conectado con la respuesta 4,, y otro conjunto $7 está co- 
nectado con A, ¿cómo vamos a predecir la probabilidad de respuesta a un com- 
puesto o patrón de prueba que consta de 4, elementos de S, y +, elementos 
de Sa? La premisa de la TME es que las probabilidades de respuesta se determi- 
nan por las proporciones de elementos de estímulo en la muestra conectada con 
las diversas respuestas. En la situación de prueba antes descrita, la probabilidad 
de la respuesta A, se espera que sea 2,/(1, + 1), y de Az, n/ (1, + 51). Además, 
si hacemos que S; sea un tercer conjunto de elementos de estímulo con una mitad 
aleatoria de los elementos $, conectada con A, y la otra mitad de los elementos 
conectada con Aj. Si el compuesto de prueba consta de x, elementos de S,, n, de 
S», y ny de $,, entonces la proporción esperada de respuesta Ay, será: 


_ 2 + 12m, 
»= RA+ MAN, 

El término 1/2x, en el numerador es la cantidad esperada de elementos »y co- 
nectados con Ay, y extraídos del conjunto de estímulo $. 

Un experimento realizado por Schoefiler (1954) ofrece una prueba de estas predic- 
ciones. Los tres conjuntos de elementos de estímulo se determinaron como diferen- 
tes conjuntos de ocho lámparas pequeñas tipo joya, dispuestas en un arreglo de 24 
lámparas frente al sujeto. Se les entrenó primero para que accionaran un interrup- 
tor en una dirección (A,) cuando estaban presentes los elementos del conjunto Sy, 
y a moverlo en la dirección opuesta (4A)) cuando estuvieran presentes los elemen- 
tos del conjunto S2. Las lámparas Sy nunca se presentaron durante éste entrena- 
miento preliminar, y la teoría presupone que estos elementos se conectan desde 
el comienzo (permanecen así) aleatoriamente, la mitad con A, y la otra mitad con 
Az. Después de este entrenamiento preliminar, 3e sometió a prueba a los sujetos, 
en relación con sus respuestas, a diferentes combinaciones de los elementos (lám- 
paras) S,, S, y S3. Durante las series de prueba se les indicó que respondieran co- 
mo lo creyeran apropiado, y no se les proporcionó información de retroalimenta- 
ción acerca de la respuesta ''correcta””. 

En La tabla 8.2 se presentan las combinaciones de prueba usadas y los resulta- 
dos obtenidos, así como las predicciones de las tres diferentes combinaciones de 
reglas, Para ilustrar la manera de interpretar la tabla 8.2, considérese el quinto 


Cap. 8. Teoría del muestreo del estimulo 281 


patrón de prueba (hilera 5) que consta de 8 lámparas del conjunto S,, 4 lámparas 
elegidas aleatoriamente del conjunto S, y las 8 lámparas del conjunto S,. Para esta 
combinación, la frecuencia relativa promedio de respuestas A, para el grupo de su- 
jetos era de 0.62. 

La columna de los valores pronosticados, denominada regla del promedio, 
emplea la fórmula derivada antes de la TME. Por ejemplo, para la prueba 6, que 
consta de 3, 2 y 8 elementos de S,, S, y Sy respectivamente, el valor pronosti- 
cado es: 


Este valor pronosticado es idéntico al valor observado de 0.67. De hecho, con la 
excepción del segundo patrón de la prueba, las predicciones de la regla del prome- 
dio son uniformemente cercanas a los valores observados. 

La regla de los elementos neutrales, una alternativa sugerida por el trabajo de 
LaBerge (1959), aplica la regla del promedio, pero presupone que los elementos 
5, son neutrales y no contribuyen a A,, nia Az. Por ejemplo, en la prueba 6, la hi- 
pótesis de los elementos neutrales suprime los 8 elementos S, y pronostica p = 
8/(8 + 2) = 0.80. En la tabla 8.2 puede observarse que en las pruebas 5 a la 8, en 
las que los dos conjuntos de predicciones difieren, la regla de los elementos 
neutrales es considerablemente, inferior a la regla del promedio. 

La última hipótesis, llamada regla de la mayoría en la tabla 8.2, presupone que la 
respuesta está determinada por cualquier elemento condicionado que se en- 
cuentre en la mayor parte de la muestra, Tales datos desacreditan la regla, que en 
un principio parecía plausible. 

Hay muchos otros conjuntos de datos de este tipo general, en los cuales la regla 
del promedio se comprueba mediante sus predicciones acerca de las proporciones 
de la respuesta a las nuevas combinaciones de estímulos, condicionados. Por lo 
general, la regla del promedio ha resistido estas pruebas y al parecer constituye 
una excelente premisa de trabajo para manejar esa clase de problemas. 


TABLA 8.2. Proporciones de respuesta A,, observadas y predichas, para cada uno 
de los nueve patrones de prueba (hileras). La composición de los patrones 
de prueba seindica por las entradas en las columnas bajo E, Ey, Ej. 
Véase el texto para la explicación de las predicciones 
(tumada de Schoeffler, 1954). 


Nóm. de Predichos por 

Patrón de elementos de pla) Regla del Elementos Reglas de 
prueba Er Ez Ej observados promedio neutrales la mayoria 

1 8.80 0.54 0.50 0.50 0.50 

2 84.0 0.79 0.67 0.67 1.00 

3 820 0.81 0.80 0.80 1.00 

4 42.0 0.63 0.67 0.67 1.00 

5 8 4 8 0.62 0.60 0.67 1.00 

6 828 067 0.67 0.80 1.00 

7 4.28 0.54 0.57 0.67 1.00 

B 808 073 0.75 1.00 100 

9 888 0.54 0 50 0.50 0.50 
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Se requiere de una explicación acerca de la forma en que la TME interpreta los 
resultados del compuesto de estímulo en los experimentos de condicionamiento 
simple donde se registra una sola respuesta, como la salivación o la presión de pa- 
lanca, En tales experimentos, la combinación de prueba de S, + S, suele producir 
una RC mayor que cualquiera de los estímulos solos. Para manejar éste y otros 
resultados de los experimentos de condicionamiento, la TME presupone que cada 
estimulo condicionado siempre ocurre junto con un grupo aleatoriamente variable 
de estímulos de fondo que no están condicionados a la RC. Por llo tanto, el ensayo 
del compuesto EC tiene una proporción más elevada de elementos condicionados 
en la muestra, en relación con Jos elementos de fondo no condicionados (%, + 
A¿[n, + 17 + n,) que con los de un solo ensayo EC (1,/%, + 25). Así, se espera 
que la RC ocurra al compuesto más que al $, aislado. Por lo tanto, al postular indi- 
cios de fondo incondicionados en estas situaciones, esta '“superaditividad”” apa- 
rente es consistente con la regla del promedio, de Schoeffler. 


Aprendizaje de probabilidad 


Una porción considerable del trabajo experimental inicial en la TME se llevó a 
cabo en la situación del aprendizaje de probabilidad. En su arreglo más sencillo, la 
tarea del sujeto consiste en predecir en qué ensayo va a ocurrir uno de dos even- 
tos. Después que ha dado su respuesta predictiva, se le muestra el evento real. 
Un ejemplo experimental sería el de un sujeto que predice si se encenderá una 
lámpara de la izquierda o de la derecha en cada ensayo; su predicción de izquierda 
(4 y o de derecha (4)) va seguida por el hecho de que el experimentador enciende 
la lámpara de la izquierda (Ey) o la de la derecha (E y). La característica común de 
estos experimentos es que los eventos ocurren en una secuencia aleatoria, y por 
lo común no hay información asequible para ayudar al sujeto a predecir a la perfec- 
ción qué evento ocurrirá. La denominación aprendizaje de probabilidad describe tal 
situación. 

A, y 4, designarán las dos respuestas predictivas del sujeto y E, y Ez a los dos 
eventos, E, significa que la respuesta A, era correcta en un ensayo dado. Cuando se 
informa el sujeto después de su predicción que E, era el evento correcto, suponemos 
que termina el ensayo al repetir A,; así el evento E, (o E.) determina lo que era retor- 
zado, y es independiente de qué respuesta predictiva se dio. Nótese que no importa si 
la respuesta predictiva del sujeto se confirma (o “'recompensa'”) por la consecuencia 
E correspondiente, sino que el condicionamiento sólo depende del evento E al fi- 
nal del ensayo, y no de su correspondencia con la respuesta predictiva del sujeto. 

Supóngase que ” denota la probabilidad de que el evento reforzante E, ocurra 
en el ensayo nm, y 1— s es la probabilidad de un E, en el ensayo =. Si ocurre un 
evento E,, se supone que f, aumenta; si ocurre un evento Ez, se Supone que P,, 
disminuye. El cambio promedio en la probabilidad de respuesta A, se obtiene al 
sopesar el incremento en la ecuación 1 por 7 (la probabilidad de un E |) y el decre- 
mento en la ecuación 4 por 1 — r (la probabilidad de un evento E). Esto produce 
lo siguiente: 


Pra = RÍA — 0 Pp. + 9 + (1— 710 —5 p,] 
= (1—0)p, + 67 (5) 
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En el transcurso de muchos ensayos la ecuación 5 conduce a la siguiente curva 
del aprendizaje: 


p.= a—(a—p) (10) (6) 


Esta ecuación dice que a medida que avanza el entrenamiento, la probabilidad 
de que un sujeto prediga un £, termina por igualarse a , la probabilidad objetiva de 
un evento E,. Es decir, el término (1 — 0)”-* baja a cero a medida que a se hace 
más grande, y hace que f, = ”. Un experimento típico podría tener ensayos de 
carreras repetidas entre dos caballos, Ned (44) y Jack (A¿), y el sujeto humano 
imenta predecir qué caballo ganará en cada carrera, Si Ned gana, por ejemplo, 
tres cuartas partes de las carreras contra Jack, entonces la ecuación 6 implica que 
los sujetos a la postre terminarán por pronosticar en tres cuartas partes de los en- 
sayos (carreras) que Ned será el triunfador. 

La igualación de las probabilidades de respuesta con probabilidades de evento 
reforzante no es una predicción obvia. Además, infringe el principio de economía 
según el cual las personas siempre deberían escoger aquella opción cuyo valor es- 
perado sea superior, ya que ese principio dicta un 100% de elección de la parte 
que gana con mayor frecuencia. Pero la igualación de probabilidad sale de las pre- 
misas TME de que los sucesos reforzantes E, y E, tienen efectos simétricos para 
hacer aumentar af, yal Pro 

Esta predicción de igualación se ha comprobado muchas veces y se la encuentra 
a menudo; además, Jas predicciones de la teoría son bastante exactas en lo que 
respecta a la forma de la curva del aprendizaje. Los experimentadores también 
han investigado el aprendizaje empleando diversos medios para la programación 
de los eventos reforzantes E, y Ez. Tan sólo para ilustrar la variación, la proba- 
bilidad de un evento E, puede ser constante (como en la ecuación 6), o puede va- 
rar en el transcurso de los ensayos, de acuerdo con la respuesta en el ensayo n, o 
según la respuesta o el evento reforzante que ocurría unos cuantos ensayos antes. 
No importa cómo se genera la secuencia E,/E, la teoría predice —y nosotros ob- 
servamos— la igualación de probabilidad de la proporción subsiguiente de res- 
puestas A, del sujeto a la proporción subsiguiente de eventos reforzantes E. . 


Variantes del aprendizaje de probabilidad 


Este resultado de igualación de la probabilidad se ha conseguido de diversas for- 
mas. Binder y Feldman (1960), por ejemplo, demostraron que el principio de la 
igualación predice las frecuencias de respuesta en la pruebas con componentes de 
estímulo simples, que en el entrenamiento previo han sido parte de los patrones 
de estímulo, Para ilustrar este punto, supongamos que a, b y c representan tres 
estímulos componentes. Ante el patrón ab entrenamos la respuesta A,; ante el 
patrón cb entrenamos la respuesta Az. Desbalanceamos las frecuencias de modo 
que el patrón ab ocurre, por ejemplo, cuatro veces más que el patrón cb. Binder y 
Feldman descubrieron que una prueba posterior sólo ante b, producía alrededor 
del 80% de respuestas A,, y 20% de respuestas Az. Este resultado puede in- 
terpretarse en TME al notar que cuando el elemento b ocurría (dentro de los 
patrones de entrenamiento), la respuesta Ay se reforzaba cuatro de cinco veces, 
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Por lo tanto, la probabilidad de que b estuviera conectada con A, igualaría esta fre- 
cuencia relativa de 4/5 reforzamientos de E, a E). 

Otra línea de trabajo investiga la igualación de probabilidad en las situaciones de 
interacción elemental que impbican a dos sujetos al mismo tiempo. Ambos trabajan 
concurrentemente en tareas de aprendizaje de probabilidad en ensayos de fila 
apretada. En cada ensayo el sujeto da una de dos respuestas y recibe reforzamien- 
to por una de ellas. El nuevo método es que las probabilidades de los eventos re- 
forzantes en cada ensayo dependen de la respuesta de ambos sujetos en ese ensa- 
yo. Los programas de reforzamiento para los dos sujetos son interactivos en el 
sentido de que la probabilidad de un evento E, para el sujeto A depende de la res- 
puesta del sujeto 5h, así como la del A. Para aplicar el modelo a tales situaciones se 
requiere de técnicas matemáticas especiales, ya que las conductas de A y de B 
cambian en el transcurso de los ensayos. Cuando se aplican a una variedad de 
dichas condiciones interactivas, las predicciones asintóticas se hacen muy se- 
mejantes a los datos obtenidos (Suppes y Atkinson, 1960). Como antes, la predic- 
ción es que ambos sujetos igualarán su frecuencia de respuesta A, con la frecuen- 
cia del evento E,. 

Se han investigado diversas generalizaciones del experimento del aprendizaje 
de probabilidad y de la teoría. En un procedimiento (Suppes et al., 1964), la res- 
puesta del sujeto y el evento reforzante varían durante un continuo completo en el 
cual hay, en principio, un número infinito de opciones de respuesta. En la tarea 
empleada, el sujeto trata de predecir dónde aparecerá un punto de luz en el borde 
de un gran círculo colocado frente a él. La generalización de Suppes del modela li- 
neal para esta situación parece explicar bastante bien las distribuciones de la res- 
puesta media. En una segunda variación (Suppes y Donio, 1967) se eliminaron los 
ensayos de elección discreta. La situación está dispuesta de tal forma que el sujeto 
siempre se encuentra en el ''estado de respuesta” A, o Az. Por ejemplo, podría 
sostener un interruptor de palanca que en todo momento tendría que mantener 
oprimido al lado derecho o al izquierdo. El sujeto tiene libertad de cambiar sus es- 
tados de respuesta en cualquier momento. Los eventos reforzantes podrían ser, 
por ejemplo, lámparas a izquierda y derecha que centellean brevemente a interva- 
los aleatorios, donde se registra un punto si el sujeto tiene su interruptor de res- 
puesta en el mismo lado en que destella la lámpara. En esta situación la principal 
variable dependiente es la proporción de tiempo que el sujeto se encuentra en el 
estado de respuesta A,. La situación, que en muchos detalles se asemeja a una si- 
tuación de operante libre, tiene variables independientes como la tasa de tiempo 
en la que se entregan reforzadores, y la proporción (1) de los reforzamientos que se 
dan en el lado A,. La principal predicción que se ha confirmado es que la propor- 
ción de tiempo que el sujeto pasa en el estado A,, convergirá asintóticamente 
a r, la proporción de reforzamientos A,, y esta asíntota será independiente de la 
tasa de tiempo en la que se dan reforzadores E, o Ez. 

Una tercera variación de la tarea usual de aprendizaje de probabilidad, estudiada 
por Neimark y Shuford (1959) y L. R. Beach y sus colaboradores (1970), requiere 
que los sujetos hagan estimaciones, ensayo por ensayo, de la probabilidad de que 
el evento E, vaya a ocurrir en el siguiente ensayo o haya tenido lugar durante la 
serie pasada de ensayos. De modo muy similar a las proporciones promedio de las 
respuestas predictivas de Ay, estas estimaciones de probabilidad comienzan casi 
por casualidad, y entonces convergen con la práctica continua a r, la verdadera 
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probabilidad del evento £,. En otro trabajo, Reber y Millward (1968) des- 
cubrieron que a los sujetos se les podía llevar rápidamente a la igualación de even- 
to en sus predicciones de 4,, al hacer que en vez de predecir rasgos individuales 
sólo observaran la rápida exposición de una serie de eventos E,/Ez. Lo importan- 
te era la exposición simple a la serie de información probabilística más que a las 
*'recompensas”' y ““castigos”* para las respuestas predictivas manifiestas. 


Estadísticas secuenciales 


Nuestra discusión demuestra que el modelo predice la curva media del aprendi- 
zaje y el valor límite de las proporciones promedio de la respuesta, a medida que 
aumentan los ensayos. Parte del poder de los modelos del aprendizaje es que nos 
permiten predecir mucho más que aquellas curvas medias de respuesta. En prínci- 
pio, las predicciones pueden derivarse para cualquier característica de los datos 
que deseemos exarninar. 

La estadística secuencial proporciona una fuente primordial de información acer- 
ca del proceso del aprendizaje. Estos estadísticos calibran el grado en que la res- 
puesta de un sujeto en el ensayo 1 + les influida por sus respuestas y/o eventos 
reforzantes en uno o más ensayos anteriores. La historia inmediata de eventos de 
un sujeto en los ensayos x, 2 — 1, etc., tiene un poderoso efecto sobre su probabilidad 
de respuesta en el ensayo 1 + 1. Los estadísticos secuenciales nos permiten exa- 
minar dichos efectos. Por ejemplo, cabría esperar que la probabilidad de la res- 
puesta A, aumentara en el ensayo que sigue a un evento E,, y disminuyera des- 
pués de un evento E). 

La teoría del muestreo del estímulo puede predecir la mayor parte de las depen- 
dencias de un ensayo observadas en los datos. Las discrepancias entre las predic- 
ciones del modelo y las elecciones secuenciales de las personas aparecen cuando 
examinamos dependencias de respuesta que se acortan durante diversos ensayos. 
Por ejemplo, el modelo predice que durante una aplicación de eventos E, la pro- 
babilidad del sujeto de predecir £, debería incrementarse monotónicamente. Pe- 
ro, por el contrario, en los ensayos inciales de un experimento, los resultados a 
menudo muestran el patrón opuesto, y el sujeto humano se vuelve cada vez más 
propenso a predecir X, mientras más haya durado la actual aplicación de los even- 
tos E, (y viceversa para las aplicaciones E). Es como si el sujeto creyera que la 
aplicación E, hacía que un suceso £, fuera cada vez más propenso a ocurrir a fin 
de emparejar las proporciones de la serie. A esta singular creencia se le denomina 
efecto negativo de recencia, o 'falacia del jugador”, y se trata en verdad de una 
idea muy arraigada que la mayoría de nosotros tenemos acerca de los eventos del 
mundo real. 

Un segundo conjunto de discrepancias surge del hecho de que los sujetos pare- 
cen estar comprobando hipótesis alrededor de la serie de eventos. Es decir, el su- 
jeto típico tiene una fe implícita en la noción de que la serie de eventos E E, que 
el experimentador le muestra posee un patrón sistemático aunque complejo; por 
lo tanto, construye, prueba y evalúa un conjunto de hipótesis acerca de las regula- 
ridades locales, ensayo por ensayo, en la serie de eventos. Ejemplos de tales hi 
pótesis podrían ser la creencia de que los eventos están programados para una al- 
ternación doble (camo en 221122112211), o que sólo se usan las explicaciones de 
una longitud de dos y cuatro eventos idénticos (como en 111122112222). En un 
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programa de reforzamiento en verdad aleatorio, estas creencias en la regularidad 
local prácticamente equivalen a supersticiones elaboradas aunque, a pesar de ello, 
son persistentes. En el capítulo 12 veremos un modelo de simulación por compu- 
tadora desarrollado por Feldman (1961), diseñado para tratar con este enfoque de 
comprobación de hipótesis para la situación de aprendizaje de probabilidad. 

¿Significan estas discrepancias que la TME explica de modo fundamentalmente 
incorrecto el aprendizaje de probabilidad, como ha argumentado N. H. Anderson 
(1964)? Algunos psicólogos así lo creen y han intentado desarrollar modelos de la 
forma en que la gente aprende secuencias sistemáticas (Myers, 1970; Vitz y 
Todd, 1967). Una teoría alternativa que propone Estes (1972a) consiste en iden- 
tificar los elementos de estímulo con memorias o huellas de la secuencia pasada de 
consecuencias y respuestas justo antes del ensayo nm, y suponer que estos 
estímulos huella de secuencia pueden condicionarse de la manera estándar a res- 
puestas predictivas. Así, por ejemplo, en un serie en la cual se alternan los even- 
tos el sujeto asociaría la huella de estímulo de un E, en el ensayo previo con la 
emisión de una respuesta A, actual, y la huella de un E, previo con una respuesta 
actual Ay. Este enfoque general ha probado ser fructífero para explicar muchas de 
las discrepancias entre el modelo TME estándar y los estadísticos secuenciales 
observados en los experimentos de aprendizaje de probabilidad. 


Recuperación espontánea y olvido 


Los fenómenos de la recuperación espontánea y del olvido se han reconocido 
desde hace mucho tiempo. Pavloy fue el primero en informar de hechos relaciona- 
dos con la recuperación espontánea (véase la figura 3,2). A continuación de la ex- 
tinción experimental de una respuesta condicionada (RC), la RC mostraba alguna 
recuperación si se alejaba al perro del aparato, y se le permitía descansar en su 
perrera durante Unos momentos antes de volver a la situación experimental y ser 
sometido a prueba. La RC se había “recuperado espontáneamente”, sin ningún 
recondicionamiento especial de parte del experimentador. Estudios posteriores 
demostraron que la cantidad de recuperación se incrementa con la longuitud del in- 
tervalo de descanso entre las sesiones. Pavlov y otros investigadores también han 
realizado experimentos en los cuales la RC se extinguía repetidamente en el 
transcurso de sesiones diarias consecutivas. Informaban que la cantidad de recu- 
peración de la RC se hacía cada vez menor conforme avanzaban las sesiones de 
extinción; a la postre, la RC no se recupera en absoluto. 

Los factores sobresalientes del olvido y la regresión espontánea son muy simila- 
res (Ebbinghaus, 1885). La magnitud de lo olvidado aumenta con el tiempo trans- 
currido desde el final de la práctica, y la cantidad del olvido, sesión a sesión, se ha- 
ce progresivamente menor a medida que continúa la práctica diaria en una tarea, 
Estes (19554) señalaba la estrecha relación de la recuperación espontánea y el ol- 
vido. Como se muestra a continuación las similitudes de sus leyes funcionales son 
evidentes, 

Estes (19554) propuso interpretar los cambios espontáneos en las probabilida- 
des de la respuesta como debidos, al menos en parte, a los cambios aleatorios en 
el ambiente de estimulación de una sesión experimental a la siguiente. En nuestro 
examen de la teoría del muestreo del estímulo se presuponía que la población del 
estímulo era fija, y que las muestras aleatorias de esta población eran efectivas de 


Cap. 8. Teorla del muestreo del estimulo 287 


ensayo a ensayo. Estes propuso ampliar esta representación al presuponer que en 
cualquier momento dado Sólo una porción de la población total de estímulos está 
disponible para la muestra, y que el resto no lo está en ese momento. Con el 
transcurso del tiempo, diferentes elementos de estímulo se hacen efectivos o dis- 
ponibles para la muestra, mientras que los elementos previamente disponibles 
pueden volverse temporalmente inasequibles. El tipo de factores que Estes tal 
vez tenía en mente puede Justrarse por las fluctuaciones cotidianas en la tempera- 
tura y la humedad de la sala experimental, los cambios en el ambiente interno del 
sujeto, sus disposiciones o actitudes corporales, la sensibilidad de varios recep- 
tores, etcétera. Tales fluctuaciones en estímulos sutiles están prácticamente 
fuera de control. La teoría no tiene por qué comprometerse respecto a la magni- 
tud de tales cambios: dicha magnitud ha de estimarse mediante la inferencia a par- 
tir del cambio en la conducta. 

Resulta evidente que si ocurren esos cambios aleatorios del estimulo, ellos ayu- 
dan a explicar los cambios espontáneos en las probabilidades de respuesta entre 
las sesiones experimentales de prueba, La regresión o el '*olvido”” debería produ- 
cirse si los elementos disponibles condicionados a la respuesta se sustituyen du- 
rante un intervalo de descanso por elementos, antes no disponibles, que no han 
estado conectados con la respuesta. La recuperación espontánea tendrá lugar si 
aquellos elementos ante los cuales se ha extinguido la RC (al final de una sesión de 
extinción) se reemplazan por elementos previamente condicionados a la RC. En la 
figura 8.4 se ilustran estos dos esquemas, y se muestran los conjuntos de indicios 
“disponibles** y '“no disponibles” al final de la sesión » y al comienzo de la sesión 
a +1 
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adquisición p= 0.25 
p=1 


o .. » 
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Figura 8.4. Ilustración hipotética de la fluctuación de estimulo que produce olvido 
[cuadro superior) o recuperación espontánea (cuadro inferior). Los conjuntos de ele- 
mentos disponibles (£) y no disponibles (E”) están divididos gráficamente entre las dos 
cajas. Los elementos de estimulo se representan con puntos. Los puntos blancos in- 
dican elementos condicionados a determinada referencia de una RC; los negros se- 
ñalan elementos conectados a conductas incompatibles (Estes. 1955a) 
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En el cuadro superior se describe el caso que produce olvido. Al término de la 
sesión de adquisición, todos los elementos de estímulo disponible se han condi- 
cionado a la KC (puntos blancos), mientras que no lo han sido los elementos no 
disponibles. 

Durante un intervalo de descanso, los elementos se intercambian progresiva- 
mente más entre los dos conjuntos, lo cual origina un estado final como el que 
se muestra enla parte superior derecha de la figura. Esto significa que si al animal se 
le volviera a someter a prueba en este intervalo, la probabilidad de una RC habría 
disminuido casi a un cuarto, un claro casu de olvido. La magnitud de olvido que 
ocurra depende de diversos factores, como el grado de condicionamiento previo 
de los elementos no disponibles durante esta última sesión de entrenamiento. En 
el cuadro superior de la figura 8.5 se presentan varias de esas curvas del olvido, 
que muestran menos olvido mientras más sesiones de emrenamiento ha tenido el 
sujeto antes del intervalo de retención. 

En la parte inferior de la figura 8.5 se describe el caso contrario, la recuperación 
espontánea de una respuesta condicionada extinguida. Presupóngase que al ánal 
de diversas sesiones de adquisición todos los elementos de estímulo se han 
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muestreado y condicionado a la RC (puntos blancos). Una sesión de extinción ha- 
ce que todos los elementos de estimulo disponibles pierdan sus conexiones con la 
RC (o que se conecten con una respuesta incompatible con la RC), Durante un in- 
tervalo de descanso, los elementos todavía condicionados, que antes no estaban 
disponibles, se vuelven disponibles cuando se da una nueva sesión de prueba. En 
este caso, la RC extinguida se recuperaría desde p = 0 al final de la extinción, has- 
taun valor de p = 3/4 = 0,75 en la prueba demorada de recuperación, El grado de 
recuperación depende del nivel de condicionamiento de los elementos no dispo- 
nibles al término de la serie de adquisición. Las curvas inferiores de la figura 8.5 
muestran curvas de recuperación espontánea. 

Las curvas hipotéticas de la figura 8.5 son similares a Jas observadas en los 
experimentos. En el cuadro superior se demuestra que la teoría predice menos ol- 
vido cuanto mayor sea el número de sesiones distribuidas de reentrenamiento. De 
modo similar, en el cuadro inferior se muestra la predicción de menos recupera 
ción con más sesiones distribuidas de extinción. 

Así, se observa que la teoría de la fluctuación del cambio de estímulo explica las 
formas usuales de las curvas del olvido y la recuperación, y de sus cambios 
progresivos a medida gue continúa el reentrenamiento o la extinción, Estes 
(19554, 19555) emplea la teoría para interpretar algunos otros hechos relaciona- 
dos con el olvido y la práctica distribuida. Además, ha demostrado (19592) la ma- 
nera en que la teoría se aplica a los experimentos acerca del olvido que implican in- 
terferencia retroactiva y proactiva en términos del modelo, los estudios de interfe- 
rencia no son muy diferentes del estudio de la recuperación espontánea de 
una RC que ha sido condicionada y después extinguida (es decir, elementos co- 
nectados a una respuesta que difiere de la aprendida primero). G. H. Bower 
(19675) proporciona ilustraciones más explícitas acerca de la forma en que algunos 
resultados de estudios de interferencia pueden interpretarse en estos términos, 
La teoría de la Huctuación también se ha aplicado a experimentos relacionados con 
la memoria verbal de corto plazo (Estes, 1971; Bower, 1972d; L. R. Peterson, 
1963), en los cuales reactivos verbales sencillos se olvidan durante breves inter- 
valos de varios segundos, ocupados con actividades interpoladas de evitación de 
repetición. En este caso, se supone que el reactivo verbal está asociado con 
“estímulos contextuales de fondo'”, que se alteran progresivamente durante un 
intervalo de interpolación, antes de la prueba de retención para el reactivo sencillo 
(Falkenberg, 1972). Al parecer, los principales resultados en los estudios de la 
memoria de corto plazo pueden interpretarse en términos de esta teoría de la luc- 
tuación, En resumen, si se consideran los numerosos y diversos tipos de fenóme- 
nos que explica el concepto de fuctuación aleatoria de estímulo ha sido una hipóte- 
sis muy tructífera. 


Otras mediciones de respuesta 


Como hemos visto, la única variable dependiente de la TME es la probabilidad 
de la respuesta. Pero los experimentadores a menudo describen la ejecución de 
sus sujetos en términos de otras mediciones, como la latencia (o velocidad) de la 
respuesta, la tasa o la amplitud de la respuesta. De modo muy similar o como lo 
hacía Hull con su constructo del potencial de reacción, la TME empieza por rela- 
cionar estas otras mediciones con su principal variable dependiente, la probabili- 


290 Primera parte. Teorias asociacionistas 


dad de la respuesta. Sin embargo, en vez de postular tan sólo una relación particu- 
[ar entre la probabilidad de la respuesta y otras mediciones, en este caso la estra- 
tegja consiste en deducir esta relación mediante alguna hipótesis sobre la manera 
en que ocurren las respuestas. Con esto es posible separar las premisas acerca de 
las propiedades de la respuesta de las restantes premisas acerca del aprendizaje, 
y someterlas a prueba por separado, 

Consideremos un modelo muy simple de la probabilidad para la latencia de la res- 
Puesta. Al comienzo de un ensayo, presentamos una señal, ponemos en marcha 
un reloj y registramos el tiempo transcurrido antes de que el sujeto ejecute algún 
acto designado. Para ser específicos, supongamos que el acto en cuestión consiste 
en hacer que una rata corra varios pasos por un pasadizo recto (al final del cual hay 
una recompensa alimenticia), e interrumpir un haz de luz fuera del compartimiento 
de partida. La medición de latencia es el tiempo que transcurre desde la apertura 
de la puerta inicial hasta que la rata interrumpa el haz de luz unos cuantos 
centímetros más allá de la caja inicia!, Un modelo elemental de este proceso pre- 
supone que en cada pequeña unidad de tiempo (de k segundos de duración), el ani- 
mal ejecuta el acto necesario o hace alguna otra cosa. Dejemos que $ denote la 
probabilidad de que ejecute el acto en la siguiente pequeña unidad de tiempo, si no 
lo ha hecho. La latencia es entonces exactamente el número de unidades tempora- 
les de duración h que transcurren antes de que el acto se ejecute. Esto es similar a 
las veces que usted tiene que tirar una moneda antes de que salga “cara”. Pode- 
mos demostrar que, en promedio, la respuesta se producirá en intervalos 1/p, y 
por ello la latencia promedio será 4/p. 

Este modelo simple de respuesta nos conduce a una relación inversa entre la la- 
tencia promedio y la probabilidad de la respuesta; conforme aumenta la probabili- 
dad, la latencia disminuye, En un experimento de aprendizaje donde esperamos 
que $, cambie en el transcurso de los ensayos de acuerdo con la función del apren- 
dizaje de la ecuación 2, la latencia promedio L,, dectina a lo largo de los ensayos. 
En los dos cuadros de la derecha en la figura 8.6 se muestran dos curvas empíricas 
que se ajustaron mediante la función. La curva inferior derecha es la latencia inicia) 
promedio durante los ensayos de un grupo de ratas que aprendían a correr por un 
pasadizo a fin de conseguir una recompensa alimenticia. La curva superior derecha 
es el tiempo promedio que las ratas mantenían oprimida una palanca en una caja de 
Skinner, cuando la recompensa dependía de presionar y después, de liberar la pa- 
lanca. 

En el cuadro superior izquierdo de la figura 8.6 se proporciona la tasa promedio 
de presión de palanca (en respuestas por minuto) del mismo grupo de ratas que 
trabajaban en una caja de Skinner de operante libre para conseguir recompensa. 
Para interpretar la situación de operante libre en términos del modelo de respues- 
ta, supóngase que cada respuesta coloca en cero al reloj y que h/p es el tiempo 
promedio hasta la siguiente respuesta. Si el tiempo promedio entre las respuestas 
es h/p, entonces la tasa promedio de respuestas es el p/h recíproco, Dada la 
ecuación teórica para fp, como una función del número de reforzamientos », la cur- 
va del panel superior izquierdo puede ajustarse a los datos. 

Hemos visto así la manera en que una teoría de la probabilidad puede hacer con- 
tacto con otras mediciones de la ejecución aprendida. La amplitud de la respues- 
ta, como la magnitud de una XC salival, no se ha considerado específicamente en 
la bibliografía relacionada con la TME, aunque es fácil diseñar un modelo que haga 
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Figura 8.6. Cuatro tipos de funciones de adquisición simple derivadas de la teoría es- 
tadistiva del aprendizaje. Las curvas A, B, C y D, respectivamente, representan la 
tasa de presión de palanca en contraste con el número de reforzamientos, la dura- 
ción media de presión de palanca por bloques de 100 ensayos, los errores acumu- 
lativos medios en contraste con los ensayos de aprendizaje del laberinto en forma de 
T, y el tiempo promedio de carrera en contraste con los ensayos del experimento en 
la rampa (Estes, 1959a). 


que la amplitud sea proporcional a p,. En este caso, las curvas del aprendizaje de 
la amplitud de la RC deben parecerse a la curva de la tasa de respuesta en el 
cuadro superior izquierdo de la figura 8.6. Por otro lado, Bower (1959, 1962a) ha 
desarrollado modelos de probabilidad para describir la conducta vicaria de ensayo 
y error (VES) de los sujetos antes de que hagan una elección. Tolman (véase el 
capítulo 11) ha destacado el papel de esta conducta para guiar la eventual elección. 

Aunque los modelos simples de latencia o de tasa examinados anteriormente pa- 
recen apropiados para ajustar curvas medias de respuesta en la adquisición 
simple, es fácil de mostrar que en un nivel más detallado de prueba cuantitativa 
son inadecuados. Por ejemplo, el modelo elemental implica que cuando p, alcanza 
la unidad, todas las respuestas se producen exactamente en el tiempo 4, lo cual es 
absurdo. Además, el histograma de frecuencia relativa de los tiempos de respues- 
ta observados, raras veces tiene la forma del modelo simple. Las discusiones de 
Bush y Mosteller (1955) y McGill (1963) muestran algunos de los problemas de- 
tallados que intervienen en la exacta predicción de las distribuciones de latencia. 
Muchos trabajos en la psicología matemática se centran en el problema de prede- 
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cir las distribuciones del tiempo de reacción a lo largo de un cierto número de con- 
diciones experimentales. 

En los ejemplos del aprendizaje verbal expuestos hasta el momento, la medida 
de retención ha sido el recuerdo de la respuesta, y la TME trata directamente 
este caso, Sin embargo, una medición alternativa de retención es la memoria de reco- 
aocimiento: a continnación de la exposición de una serie de reactivos verbales, 
como palabras o sílabas sin sentido, al sujeto se le muestra una larga lista de react+ 
vos —algunos nuevos y otros antiguos—, y se le pide que señale los que recono2- 
ca por haber sido presentados en la lista de estudio. La memoria se demuestra por 
la habilidad del sujeto para discriminar entre los antiguos reactivos de estudio y los 
nuevos reactivos de distracción. Los estudiantes reconocerán que este método es 
similar a los exámenes falso-verdadero. Más adelante, en este mismo capítulo, 
veremos una forma de interpretar la memoria de reconocimiento para los reactivos 
sencillos dentro de la TME. 


Generalización y, discriminación del estímulo 


No hay una explicación completa de la teoría del aprendizaje si no incluye, al me- 
nos, una breve mención de la forma en que maneja los temas de la generalización y 
discriminación del estímulo. Aunque la bibliografía acerca de la TME es muy ex- 
tensa, aquí sólo consideraremos los principios generales del enfoque. 

La TME concibe la generalización del estímulo de la manera en que lo hace 
Thorndike en su teoría de los elementos idénticos. Una respuesta asociada con la 
población de estímulo E, se generaliza a un estímulo de prueba E, en el grado en 
que la población E, comparta elementos comunes de estímulo con la población E,. 
La situación para dos estímulos se ilustra de forma abstracta en términos de los 
diagramas de Venn, que aparecen en la figura 8.7, donde los puntos negras 
representan elementos de estímulo asociados con una RC particular, mientras 
que los puntos blancos representan elementos no conectados. Los conjuntos de- 
nominados E, y E, contienen un total de 20 y 16 elementos, respectivamente, y 
comparten un conjunto de 8 elementos comunes (en el subconjunto de intersec- 
ción / de la Égura 8.7). En la figura se muestra el estado de! sistema a continuación 
del entrenamiento en E, que ha llevado la ejecución de la RC al 75%. Presuponer 
una combinación homogénea de los elementos entre todos los subconjuntos de E y, 
significa que alrededor de 8(0.75) = 6 elementos de la intersección í estarán aso- 
ciados a la RC. Cuando entonces hacemos una prueba de la generalización al E,, la 
probabilidad de la AC será la proporción de los elementos condicionados (puntos 
negros) en el conjunto completo E,, que en este ejemplo sería 6/(8 + 8) = 0.375. 
La proporción de las RC generalizadas depende del producto de dos factores: 1. el 
nivel de condicionamiento de la XC al estímulo de entrenamiento, que se denota 
como $(E y); y 2. La proporción de la población (prueba) Ez de elementos de 
estímulo que comparte con E,, que aquí se denota como s (s por similitud del £, al 
E). Para la ilustración anterior, (Ey) = 0.75, s = 0.50, y asíia probabilidad RC al 
estímulo generalizado es AE) =sp (E) =(0.75) (0.50) =0.375, como ya se ha 
ilustrado. Los coeficientes de similitud pueden variar desde cero (conjuntos sin 
elementos comunes) hasta la unidad (superposición completa). Pero estos coefi- 
cientes nunca se observan directamente, sino que deben estimarse a partir de la 
razón de las proporciones observadas p(E;) y PLE), o por la razón de las tasas de 
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Figura 8.7. Ilustración de dos conjuntos de elementos de estimulo superpuestos. Los 
puntos negros representan elementos asociados con la misma referencia a la RC. E! 
índice de generalización del estimulo lo da la proporción de elementos que un con- 
junto dado comparte con otro. 


respuesta (véase la discusión anterior en la que se relacionan las tasas de operante 
libre con las probabilidades de la respuesta). Pero una vez que se estine el coefi- 
dente p (Ey, se le puede usar para predecir la respuesta generalizada para cual- 
quier nivel de condicionamiento, »(E ), y basarse en cualquier tipo de respuesta 
condicionada, 

Este mismo análisis de conjunto teórico del estímulo se utiliza íncluso cuando la 
TME trata con estímulos simples de una dimensión, como la altura de un tono pu- 
ro, la disposición espacial de un punto sobre una línea, o cualquiera de entre cente- 
nares de otras dimensiones cuantitativas, así corno cualitativas (Atkinson y Estes, 
1963; Carterette, 1961; LaBerge, 1961). 

En el aprendizaje de discriminación simple, las presentaciones del E, y del E, 
ocurren en alternación aleatoria, por ejemplo, con la respuesta A, reforzada al E, 
y con A, no reforzada al E, o con alguna otra respuesta Az reforzada al E,. Al pre- 
suponer las leyes usuales del condicionamiento y la extinción, el examen de la figu- 
ra 8.7 sugiere que los elementos únicos o distintivos del E, y el E, se asociarán de 
inmediato a la A, y a la A), respectivamente. Pero surgen problemas en lo que 
respecta a los elementos comunes en el conjunto de intersección J. Estos elemen- 
tos comunes que causan la generalización del estímulo también son responsables 
de las fallas para discriminar, y hacen que la respuesta a E, sea una combinación 
cargada de los elementos únicos condicionados de forma correcta y los elementos 
de intersección '*confusamente condicionados”. De acuerdo con ese modelo, a fin 
de obtener una ejecución perfecta la atención selectiva debe hacer que esos ele- 
mentos comunes de confusión se vuelvan no funcionales (habituados o desadapta- 
dos). 

Este enfoque, que trata con la atención selectiva a los indicios relevantes, se 
ejempbfica en los modelos propuestos por Lovejoy (1968), Restle (1955), Sut- 
herland y Maclkintosh (1971), y Zeaman y House (1963). La atención selectiva 
alos indicios relevantes también es el tema dominante en los modelos de compro- 
bación de hipótesis del aprendizaje de discriminación, como los de M. Levine 
(1970), Restle (1962), y Trabasso y Bower (1968). Estos modelos se examinarán 
más adelante, en este mismo capítulo. 
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Motivación 


Es necesario considerar la conceptualización de la motivación en la TME. En 
una declaración temprana e importante, Estes (1958) ntentó manejar el efecto del 
nivel de impulso sobre la ejecución al presuponer que la privación (por ejemplo, la 
privación de agua) hace que se activen ciertas fuentes orgánicas de estimulación 
(como la boca seca o las punzadas en el estómago); además, se creía que el peso 
relativo de estos estímulos de impulso en el complejo total de estimulo se incre- 
mentaba con la duración de la privación. Pero al suponer que estos estímulos in- 
ternos del impulso podrían asociarse con las respuestas instrumentales, Estes 
explicó muchos de los hechos bien conocidos que relacionan a la motivación con la 
ejecución. Asimismo, el enfoque de estímulo del impulso tiene una forma natural 
de tratar con los resultados acerca de la discriminación del impulso, en los cuales 
un animal aprende a responder discriminativamente dependiendo del tipo o la 
intensidad del nivel de impulso que experimenta en ese momento. Los ejemplos an- 
terres se refieren a impulsos internos corno el hambre y la sed, que implican pri- 
vación de alimento o de agua. Pero es evidente que la teoría se aplica igual, o me- 
jor, a los ““impulsos”” de estimulación nociva inducidos externamente, como la 
descarga eléctrica, los ruidos fuertes, las Juces brillantes, las temperaturas extre- 
mas, etcétera. Estos son casos claros en los cuales la operación de inducción del 
impulso consiste en incrementar la intensidad de una fuente de estimulación, que 
estaría asociada con alguna respuesta instrumental. El enfoque de Estes interpre- 
taba los impulsos internos a partir de la privación, de una manera análoga a nuestra 
interpretación intuitiva de tales impulsos externos. 

Al responder a varias deficiencias en esta formulación inicial, Estes (1969b) pro- 
puso una segunda hipótesis acerca del papel de los impulsos internos en la ejecu- 
ción, que ya examinamos en el capítulo 4, Se supone que la evocación de la res- 
puesta depende conjuntamente de la entrada de estímulos discriminativos y de la 
entrada (“*retroalimentación lacilitatoria””) desde un impulso positivo. En un co- 
mienzo, el mecanismo de impulso se activa sólo por una combinación de condi- 
ciones imernas resultantes de Ja privación y un estímulo externo incondicionado 
(por ejemplo, el sabor de la comida). El sabor activa el mecanismo de impulso 
(véase el cuadro « de la figura 8.8), el cual genera elementos de retroalimentación 
que facilitan y mantienen la conducta consumatoria hasta que las condiciones 
de privación interna se hayan alterado materialmente. 5e supone que la activación de 
este mecanismo de impulso puede condicionarse de la manera usual a los 
estímulos externos que preceden a la respuesta incondicionada (que activa de mo- 
do innato al mecanismo de impulso). Así, en el aprendizaje de respuestas instru- 
mentales apetitivas, el estímulo discriminativo E” que aparece en el cuadro h de la 
figura 8.8 se asocia no sólo con la respuesta reforzada (el eslabón 2 en la misma fi- 
gura), sino también con la activación del mecanismo de impulso positivo (eslabón 1). 
Esto proporciona una entrada facilitatoría mediante el eslabón 3 (simbolizada como 
+ + enel panel 5), que se suma a la asociación de los elementos de estímulo con la 
respuesta instrumental, lo cual evoca la respuesta (eslabón 4). Debido a las con- 
tingencias de reforzamiento, esta respuesta produce el reforzador (por ejemplo, 
comida) que provoca la conducta consumatoría, la que a su vez activa nuevamente 
al mecanismo de impulso positivo (eslabón 5); además, esto condiciona la activa- 
ción de impulso a los estímulos externos del ambiente reforzante (fortalece el 
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Figura 8.8. Ilustración de la retroalimentación facilitatoria de elementos amplifica- 
dores de impulso positivo. El cuadro a muestra la forma en que se combinan las conm- 
diciones de privación interna y los estímulos incondicionados del gusto para activar 
el mecanismo de impulso positivo, que proporciona retroalimentación para mante- 
ner el acto de comer. El cuadro b ilustra la situación en el condicionamiento instru: 
mental después de que el estimulo discriminativo se ha asociado con las respuestas y 
con la activación del mecanismo positivo de impulso. 


eslabón 1). Estes (1969b) plantea algunas premisas acerca de los estímulos noci- 
vos y sus mecanismos de impuiso negativo, y la manera en que determinan el 
aprendizaje de escape y de evitación. También presupone que los mecanismos de 
impulso positivos y negativos ejercen entre síinfuencias mutuamente inhibidoras. 
De este modo, Estes explica el fenómeno de la supresión condicionada, donde un 
estímulo que evoca temor (debido a su asociación pasada con el dolor) suprimirá la 
respuesta para recompensas apetitivas (véase el capítulo 7).. 

Como dijimos en el capítulo 4, esta teoría del impuiso, su condicionamiento y su 
facilitación conjunta de las asociaciones £-R para generar la ejecución, es muy pare- 
cida a la teoría hulliana de la motivación de incentivo, en la cual se supone que la anti- 
cipación de la recompensa (mediante el »,) a los estímulos discriminativos genera ex- 
citación que interviene para facilitar o energizar las respuestas instrumentales en 
marcha. Lo que hace la teoría de Estes (como lo propuso anteriormente la de Shef- 
feld, 1954) es eliminar el estatus separado de los constructos de impulso (D) y moti- 
vación de incentivo (10) en la teoría de Hull. Asimismo, la premisa de la inhibición 
recíproca entre centros de impulso negativo y positivo lleva las cosas más adelante. 


MODELOS DE ELEMENTO PEQUEÑO 


Como hemos visto, las primeras versiones de la TME representan la situación 
experimental coro un conjunto muy amplio de elementos de estímulo N, sólo una 
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muestra de los cuales afectaba al sujeto en cualquier ensayo. Con una población 
grande de elementos de estímulo, la premisa del condicionamiento de todo o nada 
de los elementos muestreados conduce al cambio gradual en la proporción de los 
elementos de la población conectados con la respuesta. 

En un artículo clásico (1959b), Estes demostró que de la TME se derivan modelos 
de aprendizaje bastante distintos si presuponemos que el número de elementos de 
estímulo (que representan una situación) es pequeño; por ejemplo, uno o dos. En 
muchos experimentos estos modelos de elemento pequeño se ajustaban más 
estrechamente a los datos que el modelo de elemento grande que vimos antes. 
En su artículo, Estes propuso cambiar algunas premisas cruciales. Primero, 
presuponía que exactamente un elemento de estímulo aleatorio de los pocos ase- 
quibles se muestrea en un ensayo dado. Al elemento de estímulo muestreado se le 
concibe mejor como la configuración o patrón total de estimulación efectiva en un 
ensayo. Segundo, al comienzo del entrenamiento los patrones de estímulo pro- 
bablemente se encuentren en un estado neutral, no condicionados a ninguna res- 
puesta experimental. Si se muestrea tal patrón neutral, sólo dará lugar a suposi- 
ciones aleatorias entre las alternativas de respuesta. Tercero, se supone que el 
reforzamiento produce condicionamiento sólo en algunos ensayos y no en otros. 
Específicamente, se presupone que el evento reforzante en un ensayo dado 
causa: 1. un condicionamiento completo, de todo o nada, del patrón muestreado 
(un evento que tiene probabilidad c); o 2. El fracaso de cualquier condicionamiento 
en ese ensayo, de modo que un patrón neutral muestreado permanece neutral al 
final del ensayo (un evento que tiene una probabilidad 1 — c). En los modelos de 
elemento pequeño, « desempeña casi el mismo papel que 6 en los modelos de ele- 
mento grande, 

Veamos las aplicaciones de esas premisas a un caso específico. De hecho, vaya- 
mos al extremo de suponer sólo «w posible elemento de estímulo para observar lo 
que sucede, Para concretar, supóngase que una situación dada de condicionamien- 
to pavloviano de parpadeo del ojo se representara mediante un patrón de estímulo 
simple que se muestrea en cada ensayo, y este patrón comienza en un estado 
neutral, no condicionado al parpadeo. Esto significa que la probabilidad inicial de 
una RC es aquí de cero. Durante los primeros ensayos de condicionamiento, el 
EC no produce respuestas condicionadas, pero la ocurrencia del soplido (el 
estímulo incondicionado) al final del ensayo puede dar lugar al condicionamiento de 
la RC al patrón de estímulo. Con probabilidad c el reforzamiento es efectivo para 
causar el condicionamiento en cualquier ensayo dado, mientras gue con la probabi- 
lidad 1 — eno logra provocar ninguno. Para un solo sujeto, en algún ensayo el con- 
dicionamiento *“ocurre””; es decir, el ET da lugar al condicionamiento del patrón de 
estímulo simple a la RC. Por lo tanto, en el ensayo inmediatamente siguiente esa 
probabilidad RC del sujeto salta ap = 1.0, ya que por suposición el patrón de 
estímulo sencillo para la situación siempre se muestrea, y ahora está condiciona- 
do. Entonces, la curva del aprendizaje para un solo sujeto se parecería a una de 
esas funciones de escalón que se presenta en la figura 8.9, al saltar desde p = 0 
hasta $ = 1 en un ensayo. Como el El continúa ocurriendo después de la RC, su- 
puestamente el sujeto permanecerá condicionado (en p = 1.0) y por esto conti- 
nuará proporcionando las RC. 

El modelo supone que el ensayo de condicionamiento efectivo para diferentes 
sujetos se da mediante un tiempo de espera aleatorio; con probabilidad e, el condi- 
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Figura 6,9. Ilustración de las curvas de aprendizaje de función escalonada para tres 
distintos sujetos que difieren en su ensayo de aprendizaje. 


cionamiento se produce con el primer ensayo del £f; con probabilidad (1 — eJe, no 
ocurre en el primero sino en el segundo ensayo, y así sucesivamente. De nueva 
cuenta, el proceso es como lanzar una moneda hasta que aparezca la primera *'ca- 
ra'”, con la probabilidad de las caras igual a c. Tal proceso implica que la probabili- 
dad acumulativa de que el condicionamiento haya ocurrido para el ensayo » se 
incrementa con los ensayos, 

Supóngase que combinamos los datos de Un elevado número de sujetos, y que 
también combinamos los datos por bloques de ensayos. Entonces la curva de 
aprendizaje promedio de grupo aparecería uniforme como la de la figura 8.10. Pero 
comprendemos que esta curva de aprendizaje promedio de grupo es engañosa, y 
que es un artefacto de combinar muchas funciones escalonadas individuales como las 
que aparecen en la figura 8.9. El contraste se muestra nítidamente en la figura 8.10, 
donde se compara la curva promedio de grupo con las individuales durante los en- 
sayos previos a que se condicionaran con éxito. La razón por la cual el promedio 
de grupo se eleva de modo uniforme es que a medida que continúa el entrena- 
miento, más sujetos han sido condicionados progresivamente, y entonces contri- 
buyen más con sus p = 1 que con sus p = 0 al promedio del grupo. 

Un hecho notable es que la curva de aprendizaje promedio de grupo, pronostica- 
da por el modelo de un elemento, es idéntica a la que predice el modelo lineal y el 
modelo de elemento grande de la TME. Los modelos difieren en el sentido de que 
el modeb lineal y el de elemento grande presuponen que cada sujeto individual 
tiene una curva de aprendizaje que se incrementa gradualmente, mientras que el 
modelo de un elemento dice que cada sujeto mostrará una función de escalón y 
que la curva uniforme surge sólo al promediar a los sujetos. La diferencia entre los 
modelos puede someterse a prueba mediante análisis apropiados de los datos. Si 
el modelo de un elemento es adecuado y el sujeto termina el entrenamiento dando 
siempre una respuesta condicionada (es decir, p = 1), no encontraríamos ninguna 
mejoría en su ejecución antes del ensayo de su último error (o fracaso para dar una 
RC). Esta falla para mejorar antes del último error se denomina respuesta esta- 
clonaria; se la espera porque el sujeto comienza en un estado no condicionado 
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(neutral, y el hecho de que haya un error en algún ensayo posterior significa que 
cuando se encuentra en ese ensayo aún no ha abandonado ese estado incondi- 
cionado (de otro modo no cometería un error). Suppes y Ginsberg (1963), y Bo- 
wer y Theios (1964) analizaron algunos experimentos de este modo, y en varios 
se demostró las funciones de escalón esperadas. En muchos aspectos, ésta es la 
prueba más poderosa para concluir que el modelo de un elemento se ajusta a un 
determinado conjunto de datos. 


El ajuste del modelo de un elemento con los datos 


El atractivo de los modelos de elemento pequeño es que son matemáticamente 
simples y, por lo tanto, permiten inferir un elevado número de predicciones para 
un solo conjunto de resultados experimentales. Las predicciones por lo general 
son sumamente exactas. Para ilustrar el rango de predicciones exitosas que son 
factibles, apliquemos el modelo de un elemento a un experimento no publicado de 
G. H. Bower acerca de una tarea elemental de aprendizaje de pares asociados. 
Treinta estudiantes universitarios aprendieron una lista de 20 pares, en los cuales 
el miembro de estímulo del par era una letra griega y la respuesta era el dígito 1 o 
2. La respuesta 1 se asignaba a 10 de los 20 estímulos seleccionados al azar. La 
lista de 20 reactivos se recorría repetidas veces en orden aleatorio, usando el mé- 
todo de anticipación, hasta que cada sujeto hacía tres menciones consecutivas per- 
fectas de la lista completa de asociados. 

Para representar esta tarea en el modelo, consideraremos el miembro de 
estímulo de cada par como un solo patrón, que siempre se muestrea cuando el 
estímulo está presente, Se considera que el patrón se encuentra en uno de dos es- 
tados: o conectado a la respuesta correcta, o antes que eso, en un estado de con- 
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jetura en donde la probabilidad de una respuesta correcta es p = 0.50 (recuérdese 
que hay dos respuestas). En cada ensayo, con la probabilidad c que sigue a la res- 
puesta correcta del sujeto, la información de retroalimentación es efectiva para 
condicionar la respuesta correcta al patrón de estímulo, si no es que ya está condi- 
cionada: con probabilidad 1 — c el reforzamiento no es efectivo y el estado del 
patrón de estímulo permanece como estaba al comienzo del ensayo. Los reactivos 
comienzan en estado de conjetura en el ensayo 1, y permanecen allí hasta que su 
reforzamiento sea efectivo; una vez-que eso sucede se mantienen condicionados, 
de modo que el sujeto responderá correctamente de allí en adelante. 

Este modelo se aplica a la secuencia ensayo por ensayo de respuestas correctas 
y errores que un sujeto da al caso de un estímulo en particular. Con 30 sujetos que 
aprenden 20 reactivos cada uno, hay 600 secuencias de datos reactivo-sujeto. En 
principio, la teoría podría aplicarse al estimar un valor de € para cada una de estas 
800 secuencias. Sin embargo, a fin de reducir la labor de computación, se su- 
pondrá que todas las secuencias reflejan el mismo valor de c. Mediante esta pre- 
misa se descubre que una buena estimación de e es 0.20. Esto significa que, en 
promedio, se necesitan 1/c = 5.00 reforzamientos para que se lleve a cabo el apren- 
dizaje de un reactivo. 

Los resultados observados y pronosticados se compararán mediante dos gráfi- 
cas y una tabla de estadísticas. Primero, en la figura 8.11 se muestra la proporción 
media de respuestas correctas en sucesivos ensayos de práctica. El ensayo inicial 
es una mera conjetura, y la tasa de éxito comienza en el valor a priori de 0.5. La fi- 
gura 8.12 es un histograma de la frecuencia relativa de los errores totales por se- 
cuencia reactivo-sujeto antes del aprendizaje. Demuestra, por ejemplo, que el 
17.3% (104 casos) de la secuencia total de 600 tuvo cero errores; 25.0% (150 ca- 
s$os) exactamente un error; 18.2% (109 casos) dos errores, y así sucesivamente. 
A partir del aumento inicial entre cero y un error, la distribución predicha sigue 
una declinación exponencial para las proporciones de secuencias que tienen cada 
vez más errores. Las predicciones relativas a la distribución del ensayo de la pri- 
mera respuesta correcta, y el ensayo del último error son similarmente cercanas a 


10 

09 
y 
E 0.8 4 
c 
Fi [<] 
$ 0,7 Figura 8.11. Propor- 
3 ciones medias obser- 
506 vadas y predichas de 
A 


! respuestas correctas 

' durante los ensayos. 

0.5: Predicciones inferi- 

; das del modelo de 

04 a e Ly un elemento (datos 

1 3 5 z 9 11 13 15 17 de GC. H. Bower, no 
Ensayos publicados). 


300 


Figura 8.12. Distribu- 
ción de probabilidad 
del número de erro- 
res por secuencia re- 
activo-sujeto antes del 
aprendizaje (datos de 
G H. Bower, no publi- 
cados) 


030- 


e 
me 
[=] 


Frecuencia relativa 


0 1 2 3 á 5 6 7 8 9 10 
Numero de errores por secuencia 


los datos. En la tabla 8,3 se presenta un resumen de varias predicciones del mode- 
lo. Las últimas 10 entradas se refieren a estadísticos secuenciales. Para explicar 
dos ejemplos, una corrida de exactamente dos errores se cuenta una vez, siempre 
que haya una secuencia de ensayo de la forma “*... CEEC...'* en un protocolo 
reactivo-sujeto. Un par de errores tres ensayos adelante (es decir, en los ensayos 
n y n + 3) se cuenta una vez, siempre que haya una secuencia de ensayo de la for- 
ma''...EXXE...”, donde las X pueden ser respuestas correctas o errores. 


TABLA 8,3, Valores medios de varios estadísticos para el experimento de pares 
asociados. Las desviaciones estándar se refieren al estadístico enumerado 
en la línea de arriba. Los estadísticos presentados son promedios por 
secuencias de reactivo-sujeto. 


Estadístico Observadas Predichas 

Errores totales 2.50 2.50 
Desviación estándar 2.34 2.50 
Ensayo de la primera correcta 1.92 1.84 
Desviación estándar 1.20 1.12 
Ensayo del último error 4:18 4.17 
Desviación estándar 4.06 4.50 
Probabilidad de error después de un error 0.42 0.40 
Total de las series de errores 1.44 1.47 
Series de un ersor 0.85 0.87 
Series de dos errores 0.33 0.35 
Series de tres errores 0.13 0.15 
Series de cuatro errores 0.08 0.06 
Número de pares de errores: 

un ensayo aparte 1.06 1.03 

dos ensayos aparte 0.85 0.82 

tres ensayos aparte 0.65 0.65 

cuatro ensayos aparte 0.51 0.51 
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La deducción de las predicciones teóricas de tales estadísticos es sencilla pero 
tardada, y aquí no tendría un propósito útil (véanse Atkinson et al., 1965; G. H. 
Bower, 1961a). Aunque podrían calcularse y predecirse una variedad de otros 
estadísticos de los datos, la muestra proporcionada basta para ilustrar la exactitud 
del modelo en este caso. La comparación de los valores observados y predichos 
revela que el modelo es muy preciso, De hecho, en este caso el ajuste de la teoría 
probablemente sea tan perfecto como todo psicólogo espera de los estudios del 
aprendizaje, Esto es aún más impresionante si se tiene en cuenta que sólo debía 
estimarse un parámetro, c, de los datos, antes de que se iniciaran las predic- 
ciones. 

Como hemos visto, el estrecho grado de correspondencia entre los datos obte- 
nidos y las predicciones de un modelo específico es muy valioso, pero a un modelo 
sele exige más generalidad en todos los experimentos, En varias publicaciones 
(Bower, 1961a, 1962b; L. Keller el al,, 1965; Kintsch, 1964; Suppes y Ginsberg, 
1962) se han dado a conocer ajustes exactos similares del modelo de un elemento 
a datos de pares asociados. Además, los análisis de los tiempos de respuesta en 
diversos experimentos arrojan resultados acordes con este modelo; es decir: a) 
ninguna diferencia en las velocidades de respuestas correctas e incorrectas, y 
constancia relativa de éstas, a lo largo de los ensayos antes del último error en un 
reactivo; b) incrementos abruptos en la velocidad de la respuesta correcta después 
del ensayo del último error, Estos resultados son congruentes con la suposición 
de un estado conjetural antes de que se produzca el condicionamiento del último 
error a secuencia reactivo-sujeto, durante el ensayo inmediatamente des- 
pués de 

En un trabajo relacionado, Restle (1962) y Bower y Trabasso (1964) utilizaron 
una versión ligeramente modificada del modelo para explicar una forma elemental 
del aprendizaje de identificación de conceptos en una tarea de discriminación. En 
ese trabajo, se suponía que el sujeto comprobaba varias hipótesis acerca de la 
solución del problema. El estado **conjetural”” corresponde al sujeto que ensaya hú- 
pótesis irrelevantes (incorrectas), mientras el estado *cordicionado'” se da cuando 
el sujeto usa la hipótesis correcta para clasificar los estímulos. Esta área de in- 
vestigación se cultivó extensamente con modelos matemáticos (Trabasso y Bo- 
wer, 1968), y así apareció una generación de mejores modelos. Los artículos de 
Chumbley (1969), Falmagne (1970) y M. Levine (1970) utibzan la teoría básica 
de comprobación de hipótesis, pero suponen que el sujeto aprende gradualmente a 
rechazar hipótesis que se probaron y descartaron, aunque quizá olvide que una hi- 
pótesis dada fue rechazada algún tiempo atrás. La bipótesis correcta tiene cada 
vez más probabilidades de ser seleccionada debido a que las hipótesis erróneas se 
eliminan paulatinamente a medida que avanza el entrenamiento. Los desarrollos 
en los modelos de identificación de conceptos se han hecho muy compatibles con 
el enfoque del procesamiento de información de la cognición (véase Gregg y Si- 
mon, 1967), que se discutirá en el capítulo 12, 

Los resultados que corroboran el modelo de un elemento en el aprendizaje de pa- 
res asociados tienen en común el hecho de que sólo intervienen dos respuestas al- 
ternativas. Resultados confirmatorios un tanto parecidos se encontraron en el ca- 
so de la memoria de reconocimiento, en la cual el sujeto dice si ha visto o no un 
estímulo particular (por ejemplo, una sílaba sin sentido) en las series presentadas 
antes (Bernbach, 1965; Kintsch y Morris, 1964; Olson, 1969), Se comprende, por 
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supuesto, que el aprendizaje de pares asociados puede ser un complicado enredo 
de procesos que implican discriminación del estimulo, aprendizaje de respuesta, 
mediadores asociativos, conjeturas estratégicas y cosas similares; según el grado 
en que éstas surjan en el experimento, se infringirá el modelo estricto de un ele- 
mento. 


Etapas de los procesos de todo o nada 


Restle (19644) propuso un fructífero enfoque para el desarrollo de modelos apli- 
cables a situaciones de aprendizaje más complejas. Postuló que las tareas complejas 
de aprendizaje podían analizarse en etapas de componentes (partes), y recomendó 
que cada etapa del aprendizaje se concibtera como un proceso de todo o nada. Como 
se advierte, el enfoque sigue la tendencia de la propuesta anterior de Guthrie. Las 
etapas del aprendizaje difieren de acuerdo con el contenido de la tarea específica que 
se aprende. Por ejemplo, en el aprendizaje de pares asociados una etapa podría con- 
sistir en el aprendizaje del término de la respuesta como una unidad; otra podría sur- 
gir de errores de confusión (generalización) entre diversos estímulos en la lista de 
pares que se aprenden. 

Esta segunda etapa se superaría cuando la respuesta correcta se asaciara con 
un aspecto discriminativo del estimulo. 

Se han propuesto otros ejemplos de modelos de multiestado para tratar con la 
relación entre las asociaciones hacia atrás y hacia adelante en las asociaciones de 
pares, la relación entre el recuerdo y el reconocimiento de pares asociados, el 
aprendizaje de respuestas emocionales e instrumentales en el condicionamiento 
de evitación, el aprendizaje de una o ambas dimensiones de estímulo en la forma- 
ción de concepto bidimensional, etcétera. 

Como hemos señalado, en estas aplicaciones se concibe una tarea dada de 
aprendizaje en el sentido de que implica varias etapas, y que cada una de ellas 
constituye una unidad de aprendizaje que el sujeto supuestamente adquiere de una 
forma de todo o nada. Cuando se usa este proceso simple de todo o nada (un ele- 
mento) para describir cada estado, el modelo de multiprocesa une diversos proce- 
sos de todo o nada. El proceso de todo o nada se utiliza como un bloque de cons- 
trucción básico. La conjunción de varios procesos de toda o nada produce un 
modelo que, en sus propiedades generales, se asemeja a una noción del aprendizaje 
de *“mejoramiento continuo”. Sin embargo, en comparación con el modelo lineal 
continuo que ya examinamos, a los modelos de etapa por lo general se les favore- 
ce tanto en lo que se refiere a su precisión para ajustarse a los datos, como a la re- 
lativa facifidad con la que pueden extraerse deducciones teóricas de ellos, 

Al parecer, esta estrategia de utilizar bloques de construcción de todo o nada 
fue exitosa y fructífera. Varios modelos de este tipo parecen operar de modo efec- 
tivo. 

La cuestión de la validez siempre gira en torno de la fuerza y agudeza con las 
que una teoría identifica las diversas subpartes de la tarea con sus parámetros aso- 
ciados, y de cuán convincentes sean los datos que apoyan la partición propuesta en 
subtareas. En algunos casos, al menos, los expertmentos diseñados especialmen- 
te alos análisis de los datos proporcionan una poderosa evidencia en favor del aná- 
Usis de la tarea propuesta por un modelo particular (G. H. Bower y Theios, 1964, 
Restle, 19644; Trabasso y Bower, 1964). 
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DESARROLLOS RECIENTES 


El campo de la teoría matemática del aprendizaje se ha desenvuelto a lo largo de 
muchas líneas, y se ha infiltrado en diversas ramas del trabajo teórico en la teoría 
del aprendizaje. Así, resulta prácticamente imposible sintetizar aquí estos grandes 
desarrollos. En gran parte, Estes se ha ido acercando a la psicología cognoscitivis- 
ta y alejándose de sus comienzos E-R guthrianos, lo cual es evidente, por 
ejemplo, en sus recientes revisiones acerca de la manera en que operan las re- 
compensas para guiar el aprendizaje. Su teoría se examinó en el capítulo 4, donde 
se dijo que los organismos forman asociaciones entre las representaciones inter- 
nas de los eventos, como las asociaciones entre estímulo y recompensa. Según 
Estes, estas asociaciones inter-eventos no necesitan basarse en conexiones de 
estímulo y respuesta. Ya vimos que esta visión le permitió explicar resultados que 
creaban dificultades en torno de la opinión de que los reforzadores son satisfacto- 
res que sólo sirven para fortalecer conexiones E-R. Una extensión de las ideas de 
Estes acerca de la recompensa ha sído la de tratar más explícitamente con la toma 
de decisiones que los sujetos efectúan en situaciones de elección preferencial. Es- 
to conduce a lo que se denomina modelo de exploración, que veremos a conti- 
nuación. 


El modelo de exploración de la toma de decisiones 


Hasta el momento se ha descrito al sujeto como si sus respuestas fueran sólo 
una cuestión de conexiones entre el estímulo y la respuesta. En muchos casos, 
éste es un enfoque útil para el análisis de la conducta, sin embargo, existen otros 
casos en los cuales las circunstancias influyen para inducir al sujeto a hacer una 
elección más deliberada. Tales circunstancias se arreglan generalmente en los es- 
tudios de la toma de decisiones, y se les imita con facilidad en el laboratorio de 
aprendizaje en estudios de elección preferencial. En el experimento usual de elec- 
ción preferencia), se le puede ofrecer repetidamente al sujeto una elección entre 
dos opciones A, y 4; (o un conjunto de pares diferentes), cada una de ellas aso- 
ciada con una consecuencia o conjunto de distintas consecuencias recompensan- 
tes, Las elecciones asintóticas del sujeto reflejan su “preferencia de ordenamiento” 
particular entre las dos o más recompensas que se comparan. Con N alterna- 
tivas de respuesta-consecuencia, hay NY + 1)/2 pares que pueden presentarse 
para elección, cada uno de los cuales varía en su orientación de izquierda o de- 
recha. La teoría del muestreo del estímulo tiene ahora un problema: debe decidir 
cómo representar la situación de estímulo a la que el sujeto responde en cada en- 
sayo. Una posibilidad consiste en suponer que cada uno de los diferentes arreglos 
NIN + 1) de estímulos de elección es un patrón distinto, y que el sujeto adquiere 
NN + 1) hábitos diferentes para responder de izquierda o derecha, cada uno aso- 
ciado con su arreglo distintivo. Pero esa representación no parece parsimoniosa, y 
sí un poco tonta. La opción preferida consiste en suponer que cada alternativa de 
estímulo representa un conjunto de estímulos con los cuales están conectadas las 
respuestas de ““acercamiento”. Entonces, la presentación de los estímulos f y k 
para la elección preferencial corresponde a la presentación de un compuesto anali- 
zable, E, + E,. El modelo de exploración intenta describir la forma en que el suje- 
to considera las posibilidades y se decide por una de ellas. 
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Como hemos visto, el enfoque de Estes trata las consecuencias recompensan- 
tes como estímulos informativos, cuyas representaciones pueden asociarse con 
estímulos o respuestas previas que están correlacionados temporalmente con es- 
tas magnitudes recompensadas. Por ejemplo, en una tarea de discriminación ver- 
bal donde la elección de una sílaba sin sentido A, va seguida por la recepción de 
cinco puntos, mientras que a la elección de la sílaba A, (con la cual se compara la 
A.) sigue la recepción de 3 puntos. la teoría supone que la persona aprende las 
asociaciones entre respuestas y retribución 4,—5 y 4,—3. Este aprendizaje podría 
ser indicado por la habilidad de la persona para predecir o anticipar verbalmente 
los puntos o el valor de cada respuesta alternativa. 

Dado este conocimiento de las retribuciones, se presume que el sujeto decide 
entre A, y 4, en tres subetapas dentro de un solo ensayo de elección deliberada. 
Primero, explora rápidamente las respuestas disponibles 4, y Az, considera una 
y luego otra, y para cada respuesta genera una predicción de la consecuencia re- 
compensante ('“puntos””) que obtendrá con la respuesta elegida en ese ensayo, 
después almacena temporalmente esta consecuencia predicha. Segundo, median- 
te el proceso de exploración, compara con rapidez el valor o la utilidad de las con- 
secuencias así pronosticadas, y finalmente escoge aquella respuesta con el valor 
predicho más elevado. Este conjunto de premisas constituye el núcleo de lo que 
Estes (1962, 1976) denomina modelo de exploración, Así, en la elección donde se 
compasan 4, —5 puntos con 4¿—3 puntos, a la postre el sujeto siempre escogerá el 
lado A,, una vez que haya adquirido las asociaciones respuesta-recompensa. Los 
Únicos casos en los que no se logra la preferencia perfecta son aquellos en los 
cuales la discriminación sensorial entre las consecuencias recompensantes es 
imperfecta (por ejemplo, es probable que una rata no pueda discriminar confiable- 
mente entre 5.02 y 5.05 gramos de masa de harina), o aquel en el que las conse- 
cuencias mismas sean paquetes complejos de *“mercancias”? o conjuntos com- 
puestos de muchos subcomponentes para los cuales fluctúan las evaluaciones. 
Desde luego, los seres humanos incrementan la discriminabilidad de diferentes 
cantidades de recompensa mediante la conducta de contar. que produce un 
estímulo muy discriminable (por ejemplo, la palabra ““once'” en contraposición a 
“*doce”” pesos). 

Considérese el caso en el cual las consecuencias que siguen a cada elección son 
probabilísticas. Supongamos que la persona se enfrenta con la situación de elec- 
ción que se ilustra en la figura 8,13. A la elección de la posibilidad A, sigue una ga- 
nancia de we en una proporción aleatoria rr, de los ensayos, mientras que va se- 
guida por la pérdida de vé en la proporción restante 1 — 7, de los ensayos. De modo 
similar, la elección de A, gana y£ con probabilidad r, y se pierde 24 con probabilidad 
1 — m2. Si el sujeto parte de la ignorancia total, cabe suponer que a través de reite- 
radas experiencias aprende gradualmente las consecuencias que pueden seguir a 
cada respuesta, y también aprende las probabilidades 7, y 12. En otras palabras, 
esta situación tiene en realidad dos tareas más pequeñas de ' “aprendizaje de pro- 
babilidad””: aprender las diferentes probabilidades de consecuencia que siguen a 
las elecciones A,, e independientemente aprender las que siguen a las elecciones 
Az. Cabe suponer que a estos dos procesos componentes del aprendizaje se les 
describe de cierta forma como a los modelos de patrón de elemento pequeño que 
se examinaron antes. 

Dado este previo aprendizaje, ¿cómo debería escoger el sujeto? El modelo de 
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exploración intenta predecir esta probabilidad asintótica de elección del mero co- 
nocimiento de las probabilidades objetivas r, y rw», y las retribuciones 4, x, y, 2, 
todas las cuales están bajo el control del experimentador. Consideramos unos 
cuantos casos especiales de la forma en que opera el modelo de exploración, Pri- 
mero, si a cualquier consecuencia que sigue a A, se le prefiere en lugar de cual- 
quiera que siga a Az, es obvio que A, constituye la elección dominante asintótica- 
mente. Segundo, considérese el caso simétrico en el cual las ganancias y pérdidas 
para las dos opciones son iguales (es decir, 1=) y 2=2), y sus probabilidades de 
retribución difieren. Asintóticamente, los eventos dentro de cada ensayo de elec- 
ción ocurren así: el sujeto genera una predicción de ganancia o pérdida para A,, y 
de modo similar para Az. Esto produce los cuatro posibles pares de predicción que 
se muestran en el cuadro 8,1. 

En la hilera de cada par de predicción también se escribe la probabilidad espera» 
da de ese par (basada en la premisa de la igualación de probabilidad asintótica de 
los dos componentes), y la decisión indicada, dado ese par pronosticado de conse- 
cuencias para ese ensayo. La regla de decisión consiste en escoger al ganador úni- 
co, si hay alguno; de ocurrir un empate, la persona deberá volver a explorar su 
memoria, hacer un nueyo par independiente de predicciones para las dos conse- 
tuencias, y continuar con ello hasta que genere un garador único. Esto equivale a 
suponer que el sujeto sigue explorando hasta que a la postre cae en la túlera 2 0 3 
del cuadro 8.1. Por lo tanto, la probahilidad asintótica esperada de que escoja A, 
será exactamente la probabilidad del par de predicción de la hilera 2 dividido por la 
suma de las probabilidades de la hilera 2 y 3: 


CUADRO 8.1. Posibles pares de predicción para ganar w ¿, o perder x y, sus 
probabilidades conjuntas asintóticamente, y la decisión en los 


cuatro casos. 
Consecuencia predicha 
para este ensayo Probabilidad de este 
Hilera Ay Az par de predicción Decisión 

1 Gana y Gana w % T (Reexploración) 
2 Gana w Pierde x % (1-1) Az 
3 Pierde x Gana w (xy) * Az 
4 Pierde x Pierde x Cry 0-19 (Reexploración) 
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(1-7) 
PA) - TmU-r) + rl)" 

En la tabla 8.4 se muestran algunas predicciones comparadas con las proporciones 
observadas de las respuestas A, en experimentos de Atkinson (1962), Siegel (1961), 
y Friedman, Gelfand y Padilla (1964). En cada experimento, los sujetos recibieron 
de 200 a 400 ensayos en una tarea de aprendizaje de probabilidad de dos elec- 
ciones, con una retribución de 5é por cada predicción correcta y una multa de 5é 
(pérdida) por cada predicción equivocada (Friedman, Padilla y Gelfand sólo usaron 
*puntos””), Diferentes grupos en cada experimento correspondían a distintos va- 
lores de 7, y xz, como se muestra en la tabla 8.4, Las predicciones se obtienen a 
briori sencillamente al sustituir los valores de *, y rr, en la ecuación 7. Obsérve- 
se que las probabilidades asintóticas de respuesta en el experimento de Siegel (así 
como en los grupos 3 y 5 de Friedman, Padilla y Gelfand) excedían la igualación de 
probabilidad, que es un resultado frecuente cuando se usan retribuciones simétri- 
cas. El ajuste de las predicciones del modelo es muy bueno en todos los casos. 

Los casos revisados sugieren la utilidad del modelo de exploración para predecir 
probabilidades asintóticas de elección en situaciones uniformes (“sin riesgo” ”), así 
como en programas probabilísticos con retribuciones y pérdidas simétricas. En 
otros experimentos que implicaban opciones múltiples, como el pareamiento de A, 
versus Az y Az versus A,, pero presentadas con diferentes frecuencias. Estes 
(1976) descubrió que los sujetos también son sensibles a la frecuencia absoluta de 
ganar para cada opción en el curso de los ensayos, no a su frecuencia relativa de ga- 
nar por cada oportunidad. Estes logró ajustar un cierto número de resultados de 

elección al suponer que el sujeto exploraba principalmente su memoria de sucesos 
exitosos, de modo que las elecciones tendían hacia la opción de ganancia más fre- 
cuente. 

En cualquier caso, es posible concluir que el modelo de exploración proporciona 
un enfoque viable de una teoría del proceso de la toma de decisiones. Se le ha utili- 


TABLA 8,4. Probabilidades asintóticas de las respuestas A,, observadas 
y predichas en 12 condiciones estudiadas por Atkinson (1962), Siegel 
(1961), y Friedman, Padilla y Gelfand (1964). 


FAY 
Experimento Crupo LA LA Observadas Predichas 
1 0.60 0.50 0.50 0.60 
Atkinson 2 0.70 0.50 D.69 0.70 
3 0.80 0.50 0.83 0.80 
1 0.75 0,25 0,93 0.90 
Siegel 2 0.70 030 0.85 0.85 
3 0.65 0.35 0.75 0.77 
1 0.80 0.80 0,47 0.50 
2 0.80 0.50 0.81 0.80 
Friedman, Padilla, 3 0.80 0.20 0.94 0.94 
y Geltand 4 0,50 0.50 0.48 0.50 
5 0.50 0.20 0.82 0.80 
6 0.20 0.20 0.47 0 50 
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zado ventajosamente en la predicción del comportamiento individual de los anima- 
les y de los seres humanos, en situaciones que van desde los pares asociados has- 
ta el aprendizaje de probabilidad. También se ha aplicado con éxito a los jue- 
gos de dos personas, en los cuales las retribuciones dependen de la acción con- 
junta de ambos jugadores (Estes, 1962). Se ha demostrado que el modelo de 
exploración se deriva lógicamente de un modelo anterior de la conducta VES de un 
sujeto en un punto de elección (véanse Audley, 1960; G. H. Bower, 1959). En 
conjunto, las nociones básicas del citado modelo prueban ser sumamente simples, 
precisas y poderosas para ordenar un conjunto de datos acerca de la conducta de 
elección, 


Memoria de reconocimiento y teoría estadíatica de la decisión 


Bower (1972d) amplió la teoría del muestreo del estímulo para explicar los re- 
sultados en la memoria de reconocimiento de reactivos. En el experimento básico, 
al sujeto humano se le proporciona una serie de reactivos verbales para que los es- 
tudie (por ejemplo, XAQH, VQX, MET), y más tarde se somete a prueba su habili- 
dad para discriminar de memoria si se mostraron o no ciertos reactivos, Así, al 
presentarle XQH, el sujeto diría: “sí, antiguo” y con VQH: “no, nuevo””. Las 
mediciones de la memorja de reconocimiento son índices de exactitud discriminati- 
va de la habilidad del sujeto para responder '“antiguo'” a los reactivos ya estu- 
diados y ''nuevo”' a los distractores nuevos. Se sabe que en esos experimentos 
de memoria de reconocimiento ciertos factores mejoran la memoria: la cantidad de 
estudio de los reactivos, un corto intervalo de retención, palabras significativas co- 
mo materiales, y la disimilitud de los distractores nuevos de los reactivos presen- 
tados con anterioridad. Hay otros factores que incrementan el prejuicio de respuesta 
de) sujeto, su tendencia a acertar sf cuando tiene dudas acerca de un reactivo; es- 
tos factores incluyen el porcentaje de los reactivos antiguos en la serie de prueba, 
las recompensas para la identificación de los reactivos antiguos versus los nuevos, 
y los castigos por omitir los reactivos antiguos versus los nuevos. Un modelo útil 
de las decisiones del sujeto en la memoria de reconocimiento es la teoría 
estadística de la decisión —conocida también como teoría de detección de señal— 
(Green y Swets, 1966), pero desafortunadamente no tiene fundamento como 
teoría del aprendizaje. 

Bower demostró la forma en que la teoría del muestreo del estímulo implicaría 
un modelo de la memoria de reconocimiento que era prácticamente como la teoría 
de detección de señal. Se supone primero que la presentación de un reactivo ex- 
perimental como VQX da lugar a una muestra de elementos de estímuio interno 
que se asocian en ese momento con el contexto experimental (llámesele rótulo de 
contexto). Conforme transcurre el tiempo, cuando volvemos a presentar el mismo 
reactivo anterior (VQX), la nueva muestra de elementos de estímulo se superpone 
cada vez menos con la primera muestra que había estado asociada con el rótulo de 
contexto. De hecho, la superposición puede describirse mediante el modelo de fluc- 
tuación, de Estes, que vimos anteriormente. Para cualquier intervalo fijo de reten- 
ción y condición de estudio, habrá alguna distribución de probabilidad del número de 
elementos en la muestra de prueba (a partir de un reactivo anterior) con una aso- 
ciación al rótulo de contexto. Esa distribución se presenta en la parte derecha de la 
figura 8.14, para una muestra del tamaño 10 y superposición de 0.50 del primero y 
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segundo ejemplos de un reactivo anterior. La otra distribución, marcada como 
nueva en la figura 3.14, es la probabilidad promedio de que una muestra activada por 
un nuevo distractor (por ejemplo, VQH) tenga un cierto número de elementos aso- 
ciados al contexto. Estas son asociaciones de contexto con elementos de un patrón 
nuevo, adquiridas debido a que este distractor se superpone (comparte elementos) 
con varios patrones que se presentaros previamente. 

Supóngase que un reactivo de prueba da lugar a exactamente tres elementos de 
estímulo con rótulos de contexto: ¿es un estímulo nuevo o antiguo? AJ examinar la 
figura 8.14 se advierte que hay mayor probabilidad de que tal muestra provenga 
más de un reactivo nuevo que de uno antiguo, de modo que en este caso nos 
decidiríamos por un '“distractor nuevo”. Si suponemos, por otro lado, que el 
reactivo de prueba daba Jugar a una muestra que contenía seis elementos con ró- 
tulos de contexto, entonces de la figura 8.14 se desprende que “antiguo” es la 
mejor respuesta. 

Estos casos ejemplifican una regla de decisión, que dice: establezca un criterio 
Cy decídase por '*antiguo'” cuando el número de elementos marcados con rótulos 
en la prueba supere a €, y en el caso contrario decídase por ““nuevo'”. Con esta 
regla, la proporción de decisiones entre reactivos antiguos y nuevos es el área to- 
tal de la distribución antigua por encima del punto de criterio: la proporción de de- 
cisiones antiguas y reactivos nuevos (denominada positivos falsos) es el área de la 
nueva distribución por encima del criterio. El criterio € es un factor de propensión 
de respuesta que el sujeto puede establecer para ai 1star su estilo general de con- 
jeturar: si establece C a un valor elevado, por ejemplo C = 9 en la figura 8.14, 
rechazará todos los reactivos nuevos, pero lo hará a costa de omitir (no recono- 
cer) muchos reactivos antiguos; si establece Ca un valor bajo, por ejemplo € = 
2, dirá "antiguo? a la mayor parte de los reactivos antiguos, pero a expensas de 
calificar erróneamente de antiguos a muchos distractores nuevos. 
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Cada elección de un criterio C produce un cierto porcentaje de decisiones de 
““antiguo'' a reactivos antiguos y, al mismo tiempo, a reactivos nuevos. Conforme 
variamos el criterio, ambas cantidades yarían juntas y trazan una curva como la 
que aparece enla figura 8.15. Estas curvas representan la probabilidad de un juicio 
““antiguo'” a un reactivo “antiguo” (aciertos) en comparación con la posibilidad de 
un juicio ““antiguo'” a un reactivo *'nuevo”” (positivos falsos). Las curvas aumen- 
tan uniforme mente desde el origen hasta el punto (1, 1), A estas curvas se les de- 
nomina características operantes de memoria, y se les observa en los estudios de 
memoria de reconocimiento cuando las condiciones influyen en el criterio de res- 
puesta que el sujeto establece en diferentes lugares. Un método simple para es- 
tablecer este criterio consiste en variar (con el conocimiento del sujeto) la propor- 
ción entre reactivos antiguos y nuevos a lo largo de diversos bloques de prueba. 
Cuanto más grande sea el porcentaje entre reactivos de prueba antiguos y 
nuevos, más abajo deberá establecer su criterio el sujeto, de modo que acepte 
más reactivos de prueba dudosos como ''antiguos”” (ya que esto constituye una 
apuesta racional). 

Tales variaciones en los procedimientos de comprobación producen porcentajes 
radicalmente distintos de reconocimientos *'antiguos”” (aciertos) y pasitivos fal- 
sos, Sin embargo, no es nuestra intención afirmar que tales procedimientos afec- 
tan a la memoria para reactivos antiguos, ni que inciden en la discriminación que el 
sujeto hace de los reactivos antiguos y los nuevos; sino que la teoría afirma que ta- 
les procedimientos de prueba sólo afectan el lugar en que el sujeto establece su 
criterio de decisión C. De esta forma, de todos los pares de puntos (o de aciertos 
versus positivos falsos) que caen a lo largo de una característica operante dada, se 
dice que muestran la misma discriminación de reactivos antiguos versus nuevos (o 
memoria), que sólo difiere en si el sujeto adopta un criterio alto o bajo. En estos 
términos, la cantidad de memoria que tenga un sujeto de reactivos ““antiguo”” de- 
pende de la distancia entre el promedio de la distribución antigua y la nueva, tal co- 
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mo aparece en la figura 8.14. Una distancia promedio grande se daría en un inter- 
valo de retención breve, después de un grado elevado de aprendizaje del reactivo, 
o cuando los nuevos distractores sean muy distintos y se superpongan muy poco a 
los antiguos. Una distancia promedio considerable entre las dos distribuciones 
también conduce a una tasa superior de aciertos y a una tasa más baja de positivo- 
falso, que se consideran como indicaciones estándar de una buena discriminación 
de memoria. En la figura 8.15 se muestra una familia de curvas calculada para el 
caso en que la distancia promedio según escala entre las distribuciones '*nuevo”' y 
““antiguo”* disminuye (desde 2.46 hasta 0.38) a medida que aumenta el intervalo 
de retención. 

La razón de examinar estas derivaciones es que la teoría estadística de la deci- 
sión al parecer constituye en la actualidad el análisis preferido de la memoria de re- 
conocimiento. Cuenta con el apoyo de muchos estudios empíricos y ha ayudado a 
interrelacionar los índices de reconocimiento sí-no, las clasificaciones de familiar+ 
dad y las pruebas de elección múltiple de la memoria de reconocimiento (véase Bo- 
wer, 1972d, para una revisión). Bower demostró Ja manera en que las ideas de la 
teoría de la decisión pueden fundirse dentro de la estructura de la teoría del 
muestreo del estímulo, y ampliar estas ideas para que expliquen los resultados 
sobre la discriminación de listas, y juicios acerca de la recencia temporal de los 
eventos experimentales. A fin de deducir la teoría estadística de la decisión, sólo 
debe modificarse el axioma de respuesta de la TME. En vez de establecer la pro- 
babilidad de una decisión *'antigua'* igual a la proporción de los elementos 
muestreados con los rótulos de contexto, la premisa se altera de modo que el 
número de elementos con rotulación en la muestra tenga que exceder de un crite- 
rio ajustable para producir una decisión “antigua”. Es característico que se hayan 
logrado varias extensiones y aplicaciones interesantes de la TME al alterar hgera- 
mente una u otra premisa de la teoria. 


Teoría de las asociaciones jerárquicas, de Estes 


La visión conductista del aprendizaje tiene una orientación de respuesta: el or- 
ganismo aprende cómo responder en situaciones específicas de estímulo. Estes 
(1972b, 1973) últimamente se ha inclinado por un punto de vista orientado a la memo- 
na. Propone que los organismos almacenan y recuperan memorias de secuencias 
de eventos (estímulos o respuestas), y que estas memorias pueden manifestarse 
de muchas maneras, no Sólo mediante una respuesta condicionada específica. Es- 
tes postulaba una forma específica para representar información acerca de los 
eventos en la memoria del organismo: el uso de elementos de control. Un elemento 
de control es corno una célula neural en la memoria que representa la conjunción 
de dos o más subunidades; un elemento de control representa un agrupamiento o 
un bloque de dos o más elementos de la memoria mediante el sistema de codifica- 
ción perceptual (tales bloques se examinaron en el capítulo 6). Los elementos de con- 
trol pueden formar asociaciones con otras unidades a fin de construir estructuras 
asociativas complejas. La idea de una jerarquía de bloques se ilustra con facilidad: 
las letras t, o, d, a, y, son unidades individuales con elementos correspondien- 
tes de control de memoría (que indican, por ejemplo, cómo reconocer y escri- 
bir cada letra); de modo similar, los grupos de letras t o, y d a y, forman unidades 
de control de memoria (para palabras); por último, el agrupamiento foday tiene un 
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elemento correspondiente de control de memoria. El diagrama que se presenta en 
la figura 8.16 ilustra los diversos niveles de agrupamientos (elementos de control) 
en la jerarquía, Si pensamos en cada línea entre los elementos de la figura 8.16 co- 
mo una asociación, tenemos gran parte de lo que Estes intentaba hacer con sus 
jerarquías asociativas. Desde que G.A. Miller (1956) introdujo la idea del bloque 
(chunk), las jerarquías asociativas como las de la figura 8.16 han sido motivo de 
discusión durante algún tiempo en la bibliografía acerca del aprendizaje serial hu- 
mano (por ejemplo, Johnson, 1970). La característica novedosa del uso que hace 
Estes del concepto del bloque fue darle una interpretación asociativa explícita, y 
utilizarlo entonces para volver a formular y explicar algunos fenómenos básicos del 
condicionamiento (así como del aprendizaje serial humano). 

En la figura 8.17 se ilustra la estructura asociativa que, según Estes, se estable- 
ce en una situación simple de condicionamiento clásico, donde un EC se parea con 
un El en un contexto experimental específico (por ejemplo, en una sala de labora- 
torio). El símbolo C., señala el elemento de control que representa el estímulo in- 
condicionado (EJ) y a la respuesta incondicionada (R7) que se da a él; el elemento 
de control del nivel superior Cs representa los eventos del EC que van segui: 
dos de la El en el contexto Xy, y (posiblemente) con la presencia de alguna fuente 
motivacional que facilita la activación. La idea fundamental es que los eslabones en 
esta estructura asociativa se pasan la excitación unos a otros, lo cual hace que las 
unidades reciban excitación para disparar. Así, cuando ocurre el EC en un contex- 
to similar a X, las dos fuentes de excitación, junto con una fuente motivacional, se 
suman en la unidad Cyu, lo que da lugar a que la excitación se transmita hacia abajo 
por la senda asociativa hasta el elemento de control, Cy. La excitación del elemen- 
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to Cy basta para causar la ocurrencia de una fracción de la RJ en anticipación al 
estímulo incondicionado. Si está ausente alguna de las fuentes de entrada del Lyo, 
entonces es posible que la activación no sea suficiente como para provocar la res- 
puesta. 

Si a la adquisición de EC-ET sigue una serie de extinción, la nueva secuencia de 
eventos es EC-no El (denotada como U), y por ello el organismo comienza a es- 
tablecer esa estructura asociativa, al instaurar la conexión inhibidora que se 
muestra en la figura 8.18 entre Cy y C... Ésta se desarrolla debido a la ocurrencia 
de un nuevo evento (es decir, no El) en un momento y lugar donde antes se espe- 
raba uno diferente (el ED. Ahora bien, cuando el EC aunado al contexto activa el 
elemento de control de nivel superior y la excitación se difunde a C.. y Cr la se- 
gunda inhibe a la primera, y por eso sólo el Cy pasa excitación a sus subunidades, 
lo que origina a una conducta incompatible con las primeras RI y RC, 

Estes (1973) aplicó esta teoría asociativa a algunos otros fenómenos del condi- 
cionamiento, como el condicionamiento de segundo orden y el precondicionamien- 
to sensorial; pero la teoría aún no se somete a prueba en detalle, mediante la com- 
paración con un conjunto de datos experimentales de condicionamiento clásico y 
operante. Estes la ha desarrollado fundamentalmente como un modelo para el 
aprendizaje de orden serial con los seres humanos. Pero un atractivo del modelo 
de asociación jerárquica es que intenta tratar los fenómenos de condicionamiento 
empleando conceptos del aprendizaje inferidos principalmente de la investigación 
acerca de la memoria en los seres inumanos. 

Como hemos dicho, Estes (1976b) postuló su teoría en gran parte para tratar 
con el aprendizaje serial. En el caso prototípico, al sujeto se le expone con rapidez 
a seis letras agrupadas (por ejemplo, V7'|X5] BZ), se le distrae al contar por unos 
cuantos segundos, y pusteriormente se le pide que recuerde las letras en orden 
serial. Ignorando la composición fonética de los nombres de las letras, podemos 
observar que en la figura 8.19 se describe una estructura de la memoria que el 5u- 
jeto establece después de ver y pronunciar las letras para sí mismo. El nodo su- 
perior, o elemento de control, denominado Z/STA, se divide entre los tres gru- 
pos, y cada grupo se divide en sus pares de letras. Estes presupone, además, que 
cada unidad de letra, cuando es estimulada, establece un persistente circuito 
cerrado reverberante de activación, de modo que el hipotético sujeto estaría repi- 
tiendo algo como '*Vee, Vee, Vee””, pero un poco más tarde pasaría a ciclos como 
“Tee, Tee, Tee*. Para Estes, el circuito cerrado reverberante de activación es 
lo que otros han denominado memoria de corto plazo. Si los ciclos reverberatorios 
de las seis letras disparan en ritmo perfecto, el sistema de la memoria sólo experi- 
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menta ciclos repetidos de VT XS BZ, VT XS BZ, y así sucesivamente. Pero si se 
produjese cualquier perturbación aleatoria en el ritmo de los cidos reverberatorios 
para las letras individuales, entonces dos o más letras pueden cambiar su orden 
temporal en este circuito de corto plazo. Los cambios de las letras en una posición 
son más probables que los cambios en dos o tres posiciones. Á medida que trans- 
cure el tiempo, aumenta la migración de la posición de una letra en la memoria. 
Debido al agrupamiento de las letras en tres segmentos con elementos de control, 
los elementos dentro de un grupo son más propensos a cambiar posiciones que 
aquellos que se encuentran a lo largo de un grupo. En vista de que Estes adoptó 
esta idea de circuito cerrado reverberatorio a fin de reflejar la memoria de corto 
plazo para la información de orden, la representación del orden serial en la memo- 
ña de largo plazo requiere de asociaciones entre los elementos en un nivel dado 
(véase Today en la figura 8,16). 

Estas predicciones y muchas otras acerca de la memoria de orden serial se confir- 
maron en una serie de experimentos de Estes (1972b), y de Lee y Estes (1977). 
El modelo es fructífero, particularmente para predecir los gradientes de errores 
posicionales de confusión en el recuerdo ordenado. De acuerdo con esta teoría, un 
sujeto olvidará y omitirá una letra si sus subcaracterísticas fonéticas (que no se 
muestran debajo de las letras en la figura 8.19) se entremezclaran (por perturba- 
dones en el proceso de reverberación) con subcaracterísticas de una letra adya- 
cente. Esa mezcla crearía confusiones fonéticas absurdas (irreconocibles), de mo- 
do que no se daría ninguna respuesta en esa posición al recordar las series. Así, la 
falla en el recuerdo de un reactivo provendría de mezclar el orden de las 
subcaracterísticas del mismo. Este modelo también explica el hecho de que los 
errores seriales son más probables con letras que fonéticamente se confunden. 
Por lo tanto, una hilera de letras con un sonido parecido, como VTBDZC, produce 
muchos más errores de orden que una hilera de letras con un sonido distinto, co- 
mo VXAGLI. 

Un punto en favor del modelo de Estes para el aprendizaje de orden es que ha 
sobrevivido a varias pruebas detalladas. Para nuestros propósitos, representa un 
modelo del aprendizaje humano que también se ha ampliado para tratar con el con- 
dicionamiento. El sentido de las jerarquías de elementos de control, de Estes, es 
muy parecido a las ideas dobles del asociacionismo británico y a los nodos de me- 
moria de orden superior de la teoría propuesta por Anderson y Bower en su libro 
Humen associative memory (1973). De hecho, Anderson y Bower postulan una in- 
tespretación proposicional específica para sus estructuras de asociación. Obtu- 
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vieron sus conclusiones mientras intentaban representar y explicar lo que la gente 
recordaba al haber leído conjuntos de afirmaciones factuales pero notaron que sus 
sistemas asociativos eran compatibles con los de la teoría jerárquica de Estes, Es- 
tos dos desarrollos hicieron que el asociacionismo entrara en estrecho contacto 
con temas centrales en la psicología cognoscitivista moderna. 


Comentarios finales 


En este capítulo sólo se han examinado unos cuantos lineamientos en la evolución 
de la teoría del muestreo de estímulo; se ha puesto el acento en sus inicios 
guthrianos y en su liberalización más reciente a manos de Estes. La teoría del 
muestreo del estímulo fue el enfoque dominante dentro de las teorías matemáticas 
del aprendizaje. Veremos ahora cómo se ha ampliado y difundido esta perspectiva, 
y después examinaremos algunos comentarios en torno a las últimas directrices 
en el pensamiento de Estes. 


Rango de aplicabilidad de los modelos matemáticos del aprendizaje 


A partir de un modesto comienzo en 1950, las teorías matemáticas del aprendi- 
zaje se han aplicado a una gama dada vez más amplia de experimentos. Las ideas 
específicas pueden variar de una aplicación a otra, pero subsiste un método conrán 
de construcción teórica. El rango de fenómenos conductuales investigados con es- 
tos métodos incluye las provincias tradicionales de la teoría del aprendizaje, más 
unos cuantos territorios recién descubiertos. Entimeraremos algunas situaciones 
o fenómenos para los cuales se han formulado y comprobado modelos rnatemáti- 
cos: condicionamiento clásico, condicionamiento operante, generalización del 
estímulo, generalización mediada, aprendizaje de discriminación; reforzamiento 
parcial y extinción, aprendizaje serial de rutina, aprendizaje de pares asociados, 
recuerdo verba) libre, memoria inmediata o de corto plazo, cambio de actitud, for- 
mación de impresión, identificación de concepto de tipo simple y complejo; apren- 
dizaje de probabilidad, memoria de reconocimiento, detección de señal y reconoci- 
miento en psicofísica; aprendizaje de imitación, condicionamiento de evitación, 
VES y latencia en situaciones de elección, tareas de búsqueda de memoria, com- 
puestos de estímulo, reforzamiento correlacionado y distribuciones de) tiempo in- 
terrespuesta; elecciones de comparaciones en pares, integración de información, 
investigaciones paramétricas del impulso, intensidad del £C, intervalo EC-El, y 
variaciones en el reforzamiento en situaciones de condicionamiento; juegos de in- 
teracción de dos personas, tiempo de reacción, recuperación espontánea y olvido, 
experimentos de interferencia retroactiva, etcétera. Esta lista es representativa 
pero, desde luego, incompleta. La teorización cuantitativa prácticamente se ha in- 
filtrado en cada dominio de la investigación del aprendizaje. 

La profundidad de las diversas aplicaciones difiere considerablemente; algunas 
consisten tan sólo en un modelo para un único experimento, otras equivalen a una 
rama central de investigación continua. Ciertas aplicaciones son casi cuantitativas, 
y en ellas se muestra que las derivaciones de algunas suposiciones generales 
explican las principales tendencias cualitativas observadas. A menudo, un modelo 
matemático sólo conduce a una reelaboración de los datos derivados de alguna si- 
tuación experimental clásica, o lleva a investigaciones de ligeras modificaciones de 
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bs situaciones estándar. En sus mejores momentos, este nuevo examen de una 
situación familiar en términos de un modelo matemático puede descubrir nuevas 
regularidades en los datos, de las que nunca se había sospechado. Por ejemplo, los 
análisis de datos orientados por los modelos de aprendizaje de elemento pequeño 
demuestran la existencia de estabilizaciones de ejecución o funciones de escalón, 
en situaciones donde antes se pensaba que el aprendizaje equivalía a un mejora- 
miento continuo y gradual en la ejecución. 

Los modelos matemáticos del aprendizaje se han aplicado para resolver cues- 
tiones relacionadas con programas educativos (Atkinson y Paulson, 1972; 
Crothers, 1965; Restle, 19640; Smallwood. 1962, 1971). Los tipos de preguntas 
investigadas incluyen: 1. cómo asignar mejor el tiempo de estudio a distintas ma- 
terias independientes, a fin de elevar el máximo lo que el estudiante aprende en un 
tiempo fijado; 2. la tasa óptima para que un maestro presente materiales en un cur- 
so en el que la comprensión de la unidad 2 requiere que el estudiante haya aprendido 
hs primeras unidades 2—1; y 3. La mejor forma de dividir un grupo grande de estu- 
diantes en pequeñas clases tutoriales, a fm de reducir al mínimo el costo total (en tiem- 
po del maestro y del estudiante) de la enseñanza de materiales específicos. Cuando ta- 
ds problemas se formulan con claridad (a menudo con condiciones que los simplifican), 
puede usarse un modelo del aprendizaje para calcular el valor de diferentes progra- 
mas, y de allí decidir qué programas deben utilizar los maestro que se proponen ele- 
var al máximo ciertos objetivos. 

Los modelos matemáticos constituyen un método o técnica para la formulación 
de teorías sustantivas, y no constituyen una teoría por derecho propio. En térmi- 
nos generales, los modelos matemáticos han guiado a los psicólogos hacia análisis 
más intensivos de los datos del aprendizaje. Los modelos nos han mostrado la va- 
losa información que puede detenerse de los datos del aprendizaje al ejecutar aná- 
hisis más perfeccionados. También han demostrado que la comprensión valiosa en 
ocasiones surge de comparaciones adecuadamente sensibles de diversas teorías 
bien formuladas sobre datos derivados de experimentos muy elementales. 

Un saludable efecto secundario del trabajo con los modelos matemáticos es la 
revelación de que tales teorías pueden producir predicciones de los datos, con una 
exactitud que está a la par de las mejores teorías físicas. Los numerosos casos 
disponibles demuestran que en la teoría del aprendizaje la precisión numérica es 
posible en un limitado dominio. Tales demostraciones son importantes para ayu- 
darnos a establecer parámetros realistas en lo que concierne a nuestras teorías. 

Las ideas de la teoría del muestreo del estímulo todavía están vigentes, aunque 
no constituyan una fuerza dominante. Gran parte del trabajo inicial en la TME se 
realizó dentro del enfoque con orientación de respuesta del aprendizaje, que en la 
actualidad parece haber perdido popularidad si se la compara con una visión de 
cuento-memoria del aprendizaje. El propio Estes ha cambiado su orientación al 
respecto, El contraste se advierte, por ejemplo, en su tratamiento inicial del 
aprendizaje de probabilidad como condicionamiento de respuesta (Estes y 
Straughan, 1954), en contraposición a su enfoque posterior (Estes, 1976) del mismo 
como almacenamiento de frecuencias de evento y su ulterior recuperación y compa- 
ración (“exploración”) para guiar las decisiones. De modo similar aunque el artículo 
inicial de Estes fue el que inspiró los modelos del aprendizaje de elemento pequeño 
dentro de la TME y la noción de etapas discretas de aprendizaje adquiridas en esca- 
lones de todo o nada, gran parte del posterior trabajo teórico ha usaddo diferentes 
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razones para justificar el modelo particular de multietapa bajo investigación. A me- 
nudo, estas teorías se formulan en términos de conceptos de procesamiento de ir 
formación. Una posible razón de la pérdida de popularidad de los modelos pro- 
babilísticos del aprendizaje es que éstos demuestran sus poderes descriptivos 
fundamentalmente al ajustar datos de experimentos de multiensayo. Pero si nos in- 
teresamos más por los procesos internos que actúan como mediadores del efecto de 
tipos particulares de experiencias sobre la memoria, un experimenta de la memoria 
de un solo ensayo, con frecuencia es la forma más eficiente de recabar datos perti- 
nentes, Aquí los materiales experimentales (a menudo verbales) se codifican una 
vez bajo uno u otro arreglo, y más tarde se investiga al sujeto para la memoria de 
esos materiales. Estos experimentos de memoria de un solo ensayo no propor- 
cionan el tipo de datos que ayudará a las teorías matemáticas del aprendizaje a 
¡mostrar sus mejores características, 

Quizá lo notable sea la facilidad con que se traducen ideas de los términos abs- 
tractos inherentes a la teoría del muestreo del estímulo a otros idiomas teóricos, 
como los de la memoria a el procesamiento de la información. El propio Estes ha 
sido especialmente hábil para demostrar cuántas de sus ideas pueden moldearse 
en términos de conceptos de memoria sensorial, mediante los cuales se concibe 
que los sujetos almacenan y recuperan información acerca de eventos y sus 
características, y el aprendizaje se produce en varios niveles distintos. Por su par- 
te, Bower (19724) mostró la manera en que las nociones de la variabilidad de codi- 
ficación pueden traducirse a la TME, y la forma en que la TME conduce con facili- 
dad a la teoría estadística de la decisión, como un medio para explicar la mentoría 
de reconocimiento de reactivo, juicios de recencia, eteétera. La disponibibdad de tales 
traducciones sugiere que las ideas básicas de la variabilidad del estímulo, de la fluc- 
tuación temporal de la estimulación y de las asociaciones de eventos son concep- 
tos viables y necesarios para explicar ciertos fenómenos, independientemente de 
cualquier vocabulario teórico que se emplee para su formulación. 

Aunque la teoría del muestreo del estímulo tiene en la actualidad relativamente 
púcos partidarios como teoría total sus ideas fundamentales se han asimilado en un 
tronco común de útiles constructos teóricos. Estes, sus colegas y seguidores con- 
tinúan desarrollando un significativo trabajo, al aplicar estas ideas la interpretación 
de fenómenos de la percepción, del aprendizaje simple y complejo, y de la toma de 
decisiones. Es probable que la teoría del muestreo del etímulo constituya el inten- 
to más relevante y consistentemente racional de teoría cuantitativa global del 
aprendizaje que se ha formulado hasta la fecha. La creación, desarrollo y transtor- 
mación constante de estas ideas han sido inspirados en gran parte por un hombre, 
William Estes, y sus colegas. La infuencia que han ejercido sobre genetación de 
psicólogos del aprendizaje es inmensa y constituye un vivo testimonio del ingenio 
del ser humano. 


LECTURAS COMPLEMENTARIAS 


Los siguientes libros presenían una introducción elemental de los conceptas psicológicos 
básicos: 


Grenno, J. G., Elementary theoretical psychology, 1968. 
Restle, F., Mathematical models in psychology: An introdwction, 1977. 
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Los libros de texto más avanzados acerca del aprendizaje son: 
Atkinson, R. C., Bower, G. H. y Crothers, E. J., Introduction to mathematical leaming the- 
ory, 1965. 
Coombs, C. H. Dawes, R. M. y Tversky, A.. Mathematical psychology: An elementary intro- 
duction, 1970. 
Restle, F. y Greeno, J. G., Introduction to mathematical psychology, 1970. 
Un texto que hace hincapié en las diversas clases de técnicas matemáticas de derivación, es: 
Levine, G. y Burke, C. J. Mathematical model technsques for learning theories. 1972. 


Se recomienda la serie de lecturas pertinentes para el desarrollo de la teoría de muestra 
del estímulo: 


Neimark, E. D. y Estes, W. K. (dirs.), Stímulus sampling theory, 1967. 
El compendio estándar de los artículos autorizados aparece en: 


Luce, R. D., Bush, R. R. y Calanter, E. ídirs.), Handbook of mathematical psychology, vols. 
LU y Il, 1963 y 1965. 
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Desarrollos recientes 
en las teorías 


conductuales 


La investigación del proceso de aprendizaje continúa a un ritmo acelerado y se 
ha expandido en varias direcciones. Varios miles de psicólogos y científicos en 
campos afines realizan trabajos que en términos generales pueden clasificarse co- 
mo investigaciones del aprendizaje, en tanto es prácticamente imposible cubrir la 
gama completa de los fenómenos que se estudian, este capítulo sálo incluirá. a 
grandes rasgos, una muestra seleccionada de los desarrollos recientes. En algu- 
nos aspectos, la investigación en torno al aprendizaje se ha vuelto más aplicada, lo 
que trajo corno consecuencia el desarrollo de técnicas conductuales relacionadas. 
Por ejemplo, algunos psicólogos se dedican a la aplicación de los principios del 
aprendizaje a la adquisición del lenguaje, a programas educativos para enseñar a 
los niños diversas habilidades intelectuales, a la modificación de pensamientos y 
conductas indeseables de los pacientes psiconeuróticos y de niños problema en s+ 
tuaciones escolares. 

Otros profesionales se dedican al adiestramiento de habilidades complicadas del 
personal industrial o militar, a la administración conductual escolar y al entrena- 
miento de niños retrasados en habilidades sencillas. 

Al final del capítulo revisaremos algunas de estas aplicaciones de las técnicas de 
modificación de la conducta en problemas del ajuste personal, habilidades académi- 
cas y motivaciones vinculadas con el trabajo. En el capítulo 15 se examinarán va- 
rios estudios acerca de la instrucción programada, un área importante de la 
tecnología conductual. La ingeniería conductual tiene objetivos prácticos inme- 
diatos, y aunque no es irrelevante para la teoría, puede llevarse a cabo sin que en 
ella interfieran los temas teóricos no resueltos. La importancia de la investigación 
del aprendizaje reside en su desarrollo de técnicas de control de la conducta, en 
el cuadro general de referencia que proporciona, en los conceptos a emplear en el 
análisis y, por último, en el conocimiento que se obtiene de las investigaciones 
particulares. 
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La tendencia fundamental de la investigación no aplicada ('*pura'”) en el aprendí- 
zaje ha sido alejarse de las extensas teorías de las décadas de 1930 y 1940, para 
aproximarse a los análisis experimentales y teóricos más profundos de los fenó- 
menos sobresalientes del aprendizaje. En este sentido, se han realizado diversos 
estudios acerca de tareas y paradigmas experimentales particulares que utilizan 
algún tipo de habilidad del aprendizaje, con la consecuencia de que la planimetría 
empírica de muchos fenómenos es actualmente muy minuciosa. Múltiples de- 
sarrollos teóricos han surgido de la corrección de malas interpretaciones ante- 
riores, y del creciente cuidado en lo que toca a exactitud, claridad y precisión de 
las explicaciones teóricas. 

En este capítulo expondremos algunos de los lineamientos destacados de las inves- 
tigaciones y teorías más recientes del aprendizaje, desde el punto de vista conduc- 
ista, Como es sabido, la principal división conceptual dentro de la investigación 
del aprendizaje es la que se suscita entre los enfoques conductista y cognosciti- 
vista. 

El prototipo de investigación del primero es el estudio de animales inferiores 
que aprenden una respuesta simple en una arreglo experimental sencillo para 0b- 
tener una recompensa biológica; el experimentador describe al suieto modelo y a 
los resultados en términos de los conceptos de estímulo-respuesta-reforzamiento, 
gue corresponden a) conductismo moderno. El enfoque cognoscitivista, por su 
parte, centra sus investigaciones en alumnos universitarios del segundo año, que 
leen una narración para comprensión y después reconstruye la sustancia del relato 
mientras el experimentador describe al sujeto y a los resultados modelo en térmi- 
nos de conceptos cognoscitivos de procesamiento de información, sistemas se- 
mánticos, estrategias reconstructivas, etcétera. El lector comprenderá que den- 
tro de las áreas conductista y cognoscitivista existe una gran variación en io que 
concierne a temas de investigación y a sujetos de la misma. Por nuestra parte, re- 
visarernos trabajos nuevos en la tradición conductista, aunque tendremos presentes 
a varios otros realizados con sujetos humanos, Después de que se hayan examinado 
las tradiciones históricas en los capítulos 10, 11 y 12, en ei capítulo 13 se verán las 
investigaciones recientes en las teorías cognoscitivo-organizacionales. En este 
último analizaremos principalmente las nuevas tendencias en la investigación del 
aprendizaje humano. Cada día se hacen más esfuerzos por construir puentes entre 
las teorías de las áreas conductista y cognoscitivista (Anderson y Bower, 1973; 
Bandura, 1977a, Staats, 1964, 1975) y, de hecho, el trabajo más interesante del 
presente y del futuro parece tener esa directriz. 

Las primeras tres cuartas partes de este capítulo tratan primordialmente el 
“condicionamiento animal'* y exponen trabajos novedosos en el campo del condi- 
cionamiento operante de respuestas autónomas, examinan ideas acerca de la habi- 
tuación y el precondicionamiento sensorial, y las concepciones cambiantes del 
reforzamiento y el no reforzamiento. Asimismo, se abordan varios aspectos rela- 
cionados con la selectividad de los estímulos y las respuestas en el aprendizaje. En 
la última parte dei capítulo revisan algunas aplicaciones de los principios del condi- 
cionamiento conductual en psicoterapia, ajuste de la personalidad, y situaciones la- 
borales. 

El tratamiento de estos temas fundamentales debe ser necesariamente breve y 
selectivo, pero habrá de proporcionar una perspectiva acerca de los modernos de- 
sarrollos en la teoría del aprendizaje. 
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PROCESOS ELEMENTALES DEL CONDICIONAMIENTO 
Control voluntario de respuestas involuntarias 


Una de las distinciones más antiguas en la psicología filosófica es la que se 
establece entre las respuestas voluntarias y las invofuntarias: las respuestas volun- 
tarias son aquellas de las cuales disponemos y a las que controlamos consciente- 
mente: Jas involuntarias ocurren de manera inconsciente, automática, sin que in- 
tervenga la intención. Los reflejos innatos: la respiración, los latidos del corazón, 
el parpadeo del ojo ante un soplido, el humedecimiento de la comida en la boca 
mediante la saliva, los procesos de digestión activados por el alimento enlos intes- 
tinos, así como muchas otras respuestas, son involuntarios y se emiten sin in» 
tención. Resulta muy conveniente que tales procesos rutinarios se ejecuten auto- 
máticamente fuera del estado consciente. Su automaticidad, representa una gran 
ventaja, ya que así nuestra atención puede despreocuparse de la vigilancia de todos 
esos aspectos. La conducta volitiva, por otra parte, es consciente, intencional y 
deliberada: constituye una expresión de las intenciones de la persona, de modo 
que consume nuestra atención o capacidad de procesamiento. 

Comprensiblemente, los psicólogos conductistas se han opuesto a asignarles 
voliciones e intenciones conscientes a sus sujetos animales: con ellos, la noción de 
control volitivo no podría identificarse con las descripciones verbales que un sujeto 
realiza de sus actos y motivos. En la psicología conductista la distinción entre vo- 
luntario e involuntario se ha traducido en una diferenciación entre dos “sistemas 
de respuesta” distintos, cada uno de los cuales Supuestamente se aprende y se 
gobierna de acuerdo con dos diversos principios del aprendizaje. Es la distinción 
que Skinner explica claramente (véase el capítulo 7) entre la conducta operante y 
la respondiente, y las leyes del condicionamiento que les son inherentes. Las res- 
puestas operantes implican a los grandes músculas esqueléticos que dependen del 
sistema nervioso central, y que se utilizan para operar instrumentalmente sobre el 
medio ambiente. En general, las respondientes son reflejos innatos que involucran 
a los músculos lisos de las glándulas o las vísceras, que se rigen por el sistema ner- 
vioso autónomo y a menudo intervienen para mantener la homeostasis o equilibrio 
de los procesos vitales internos. Skinner y otros investigadores pensaban que ta- 
les respondientes se aprendían sólo mediante la ley del condicionamiento clásico 
(pavloviano), al parear el estímulo neutral a ser condicionado con un estímulo ade- 
cuado para provocar el reflejo; las respuestas operantes, por atra parte, sólo se 
aprenderfían a partir de la ley del condicionamiento operante (recompensa), al ha- 
cer que algún reforzamiento fuera contingente a la ocurrencia de la respuesta que 
ha de condicionarse. Aunque esta teoría de los dos factores se criticó en muchas 
ocasiones, el hecho es que durante unos treinta años mantuvo una posición pre- 
ponderante en el ámbito de la teoría del aprendizaje. 

La citada teoría de dos factores disponía de un medio para explicar la manera en 
que una persona adquiere control **voluntario”” sobre una parte de la conducta 
respondiente, es decir, había una respuesta operante intermedia que de modo in- 
nato O a partir del condicionamiento pavloyiano llega a controlar a la respondiente. 
Por ejemplo, una persona puede aprender a controlar su RGP (sudoración de las 
palmas de las manos) al poner en tensión los músculos de sus piernas y torso fren- 
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te a un indicio, o diciéndose a sí misma una palabra (por ejemplo, descarga) que 
con anterioridad ha pareado con una descarga eléctrica, con lo cual evoca un refÑle- 
jo galvánico de la piel (RGP). Así, cuando le conviniese (por ejernplo, para fingir 
en una prueba de detector de mentiras), una persona podría aprender de modo 
operante a controlar su RGP. 

Todos advirtieron que para contradecir la hipótesis de dos factores era necesa- 
río demostrar que las respondientes como los cambios en el ritmo cardiaco, los 
movimientos viscerales o las secreciones glandulares se aprenden de acuerdo con 
la ley del condicionamiento operante. Además, la demostración tenía que efectuar- 
se de tal forma que una explicación en términos de un ““mediador operante'* no 
fuera admisible. Este último requisito coartaba a ciertos proyectos: ¿cómo descar- 
tar la conducta instrumental intermedia? La solución a este problema requería de 
la confluencia de varias tecnologías significativas, que se hicieron asequibles en la 
década de los sesenta. 

Primero, puede usarse la droga curare (o d-tubocurarine) para dejar fuera de 
control a la musculatura esquelética. El curare bloquea la acción de la acetilcolina 
en las coyunturas neuromusculares de la musculatura estriada que con dosis ade- 
cuadas, pierde el tono, se vuelve fláccida e inmóvil al punto que los animales ni si- 
quiera pueden respirar y se les debe administrar respiración artificial para mante- 
nerlos con vida. Sabemos que los cazadores primitivos usaban el curare en flechas 
envenenadas, que mataban a sus presas al paralizarles el sistema respiratorio. Un 
ser humano al que se le suministra curare y respira está por completo consciente 
de lo que sucede a su alrededor; puede aprender, pensar y recordar soluciones a 
acertijos lingúísticos (Leuba et «f., 1968). Por supuesto, mientras se encuentra 
hajo los efectos de la droga no puede hablar ni moverse, pero está en condiciones 
de informar de esos eventos varias horas más tarde, cuando hayan desaparecido 
tales efectos. 

Así, un posible sujeto para nuestro experimento sería un animal al que se le ha 
administrado curare. Pero surge un segundo problema: como dichos animales es- 
tán totalmente inmóviles, ¿cómo Se les recompensará cuando sus vísceras ejecu- 
ten el movimiento correcto? La solución técnica consiste en utilizar la estimulación 
eléctrica aplicada en centros de placer del cerebro (EEC) mediante electrodos 
implantados. De este modo, la preparación apropiada exigiría a un animal (por lo 
general una rata) que tiene electrodos implantados de forma permanente, con 
cualidad recompensante probada, que permanece inmovilizado con curare y se 
mantiene con vida por medio de respiración artificial. Debe tener, además, uno o 
más dispositivos electrónicos conectados para registrar alguna actividad respon- 
diente, como respuestas cardiacas, vasomotoras, o viscerales, La preparación se 
muestra en la figura 9.1, y ha sido tomada de DiCara (1970). Estas son las “pre- 
paraciones ideales” artificiales que en ocasiones se necesitan para responder a 
preguntas científicas. 

Para fines de la década de los sesenta, Neal Miller y sus colaboradores en la 
Universidad Rockefeller (Miller, 1969) habían comenzado a estudiar este tipo de 
preparación. Intentaron condicionar de modo operante varias respuestas viscera- 
les. Para ¡ilustrar el procedimiento, considérese la manera en que intentarizmos 
condicionar un incremento en el ritmo cardiaco de un animal. En una rata, éste se 
traduce en alrededor de 400 latidos por minuto pero fluctúa considerablemente; el 
ritmo momentáneo se estima mediante un contador digital que registra el número 
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Figura 9,1. Nustración de una rata tratada con curare a la que se le ha colocado una 
máscara de gas conectada con un respirador y con un electrodo en un centro de re- 
compensa del cerebro (tomada de DiCara, 1970). 


de latidos en intervalos sucesivos de 5 segundos. Supongamos que deseamos con- 
dicionar de modo operante a nuestro animal a fín de que aurnente su ritmo cardiaco 
al oír cuando un sonido, y lo mantenga normal cuando no lo escuche, Para lograrlo, 
puede usarse el método de moldeamiento y diferenciación de la respuesta. Des- 
pués de registrar el ritmo cardiaco de línea base al sonido, el condicionamiento 
comenzaría al activar dicho sonido durante 2 minutos, cada 4 minutos, y entregar 
un EEC recompensante al final de cada intervalo de observación de 5 segundos, 
en el transcurso del cual el ritmo momentáneo está por encima de una tasa criterio. El 
criterio para el reforzamiento es inicialmente bajo (por ejemplo, 1% más alto que 
el ritmo base), pero en el curso de los ensayos se eleva a situaciones más extre- 
mas conforme el animal aprende a incrementar su ritmo cardiaco durante el soni- 
do, a fin de obtener la recompensa EEC. 

Ése es el procedimiento general, y los resultados indican que se ha aplicado con 
éxito; es decir, Jos animales aprenden a cambiar las respuestas cardiovasculares y 
viscerales que son instrumentales para obtener recompensas. Las actuales inves- 
tigaciones están logrando algunos otros fines. En primer lugar, mucbas de ellas 
han tratado de establecer la generalidad de los resultados con varios sistemas de 
respuesta. La lista de respuestas viscerales que se han condicionado exitosamen- 
te en la preparación con el curare incluyen aumentos o decrementos en el ritmo 
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cardiaco, cambios en Ja tensión arterial, control del diámetro de los vasos 
sanguíneos (por ejemplo, los vasos en el rabo o en la oreja de una rata), contrac- 
ciones del intestino grueso, secreción salival y tasa de lormación de orina en los 
tíñones, Esta lista no es exhaustiva y sín duda se ampliará con futuras investiga- 
ciones. Segundo, ha surgido interés en demostrar que tales operantes condiciona- 
das siguen casi las mismas leyes que cualquier otra respuesta aprendida: 
muestran extinción, adquisición, retención, transferencia, generalización de 
estímulo y discriminación. En tercer lugar, gran parte de las investigaciones han 
intentado establecer que estos procedimientos producen verdadero aprendizaje 
asociativo verdadero y no sólo respuestas sensibilizadas, y que los cambios en el 
aprendizaje son sumamente específicos a la respuesta particular reforzada y no 
sólo un patrón general de excitación o relajamiento de todo el sistema autónomo. Lo 
primero se contestó al modificar la tasa de respuesta en direcciones opuestas, a 
dos estímulos discriminativos distintos. Así, a una rata se le podría condicionar 
para que incrementara el ritmo y la intensidad de sus contracciones intestinales por 
encima de lo normal al escuchar un sonido, pero que los disminuyera cuando se 
encendiera una luz. Al parecer, las respuestas opuestas a estímulos diferenciales 
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Figura 9,2. Recompensar aumentos o disminuciones en el ritmo cardiaco produce 
cambios en las respectivas direcciones, pero recompensar una respuesta diferente 
—las contracciones intestinales— no produce alteraciones en el ritmo cardiaco (to 
mada de N.E. Miller y A. Banuazizi, 19681. 
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descartan las explicaciones de los resultados basadas en la sensibilización general 
de una clase de respuestas debidas al EEC recompensante o a otros artificios no 
específicos. El segundo tema, la especificidad de los cambios del aprendizaje, se 
ha evaluado al monitorear varios sistemas distintos de respuesta visceral, como el 
ritmo cardiaco y la movilidad intestinal. La recompensa EEC se haría contingente 
a los cambios en una de estas respuestas, pero no a los cambios de la otra. Sin ern- 
bargo, este otru sistema de respuestas se observaría para los cambios correla- 
cionados. Un ejemplo de tales resultados se presenta en la figura 9.2; correspon: 
den a un experimento realizado por N. E. Miller y Banuazizi (1968). La gráfica 
muestra el ritmo cardiaco trazado durante aproximadamente 500 ensayos de 
entrenamiento para dos grupos de animales, la mitad de ellos recompensados (du- 
rante el E*, o tiempo en que estaba el estímulo) por acelerar su ritmo cardiaco, y 
la mitad recompensados por desacelerarlo. Durante el entrenamiento aparecen 
cambios apropiados en el ritmo cardiaco de ambos grupos. En la figura 9.2 tam- 
bién se ilustra que el hecho de recompensar una respuesta diferente 
—contracciones intestinales— no produce ningún efecto sobre la respuesta no re- 
forzada, latido del corazón. Por lo tanto, los cambios en la respuesta son muy 
especificos al sistema del que la recompensa es contingente, y no reflejan una ex- 
citación generalizada ““autónoma””. DiCara y Miller (1968) ejecutaron una proeza 
entorno a esta cuestión de la especificidad cuando entrenaron ratas para que efec- 
tuaran, a partir de un indicio, una vasoconstricción relativamente mayor (blanquea- 
miento) en kh piel de la oreja izquierda que en la de la derecha (o viceversa). Tales 
resultados muestran mucho más especificidad de las acciones del sistema nervioso 
simpático de lo que antes se consideraba posible. 


Algunos problemas de la repetición 

Estos resultados se obtuvieron en los laboratorios de Miller, en Yale, a fines de 
la década de los sesenta, y algunos de ellos se repitieron después (Fields, 1970; 
Hothersall y Brener, 1969). De allí en adelante, entre 1970 y 1975, el progra- 
ma de investigación comenzó a enfrentar dificultades en la reproducción de los re- 
sultados básicos con la preparación del curare, en particular las alternaciones 
cardiovasculares (Miller y Dworkin, 1974). Las razones que provocaron tales incon- 
venijentes aún no se han esclarecido. El problema es que las mediciones cardiovascu- 
lares cambian en respuesta a muchos otros sistemas fisiológicos, como el ritmo de 
la respiración, el grado de dióxido de carbono en la sangre, la distensión de la veji- 
ga, la temperatura corporal, etcétera. En la preparación con curare es difícil 
controlar todos estos aspectos. Por ejemplo, en los primeros experimentos a las 
ratas se les hacía respirar con una máscara que bombea aire a sus pulmones. Pero 
los pequeños movimientos de la tráquea, el velo del paladar o las fosas nasales podían 
obstruir temporalmente el paso del aire, lo cual provocaba cambios en el dióxido 
de carbono en la sangre y las consiguientes variaciones en el ritmo cardiaco, En 
otros experimentos se ha asegurado la respiración constante con un. tubo de aire 
insertado en la tráquea. En estos últimos estudios, efectuados en el laboratorio 
de Miller, el aprendizaje operante de las respuestas cardiacas mediante la prepa- 
ración con curare fue un fenómeno Jusorio, que aparecía o no, de formas frustran- 
temente inexplicables. Sin embargo, la mayoría de los investigadores creen que el 
condicionamiento operante de las respuestas autónomas en el animal tratado con 
curare es probablemente un fenómeno real, pero variable. 
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La dificultad para producir resultados confiables con ratas a Jas que se les ha ad- 
ministrado curare no debe impedimos ver el hecho de que repetidas veces se ha 
demostrado con éxito el condicionamiento operante de respuestas autónomas con 
animales y seres humanos que no se trataron con curare, Por ejemplo, en un expe- 
rimento inicial de Shapiro y sus colaboradores (1964), el uso de la RGP palmar hu- 
mana dio lugar a incrementos confiables de la sudoración en personas recompen- 
sados por aumentos, y decrementos en otros individuos recompensados por ellos 
Shapiro y Surwit (1976) revisaron cientos de casos de condicionamiento autónomo 
exitoso de contigencias operantes. Tales resutados tienen una importancia cínica 
práctica. Por otra parte, los resultados de la preparación con curare revisten una 
significación teórica que permúte excluir a los músculos esqueléticos como me- 
diadores de los cambios autónomos. 


Bjorretroalimentación y aplicaciones clínicas 


Paralelamente a estos estudios de laboratorio realizados con animales, se han 
hecho muchos esfuerzos tendientes a aplicar el condicionamiento operante con 
hiorretroalimentación para aliviar problemas de pacientes médicos. Pero en la ac- 
tualidad existen cientos de experímentos clínicos limitados de condicionamiento de 
biorretroalimentación con muchos síntomas distintos. Aunque con frecuencia se 
pregonan los éxitos obtenidos, el hecho es que no siempre se han controlado 
cuidadosamente a fin de verificar los poderosos efectos de los placebos. En este 
sentido, es de señalar que cuando se establecen los controles apropiados, los re- 
sultados a menudo son confusos. Los primeros intentos de Miller y sus colabora- 
dores de enseñar a pacientes hipertensos a bajar su tensión arterial, sólo alcanzaron 
éxitos débiles y esporádicos, quizá debido a que los enfermos únicamente practi- 
caban unos cuantos minutos, durante pocos días, cuando estaban conectados al 
aparato de biorretroalimentación en el laboratorio. Estudios posteriores sugieren 
que un síntoma persistente tal vez deba monitorearse y trabajarse en un régimen 
continuo y de tiempo completo, lo cual requiere de un aparato portátil que los pa- 
cientes puedan llevar consigo, 

Algunos de los cambios terapéuticos más llamativos en lo que concierne a la ten- 
sión arterial se deben a Brucker (1977), y a N. E. Miler y Brucker (1978), 
quienes trataron una forma de hipotensión en parapléjicos o cuadripléjicos confi- 
nados a tna silla de ruedas. En muchos de estos pacientes, la columna vertebral 
rota había desequilibrado sus mecanismos normales para el control de la tensión 
arteria] en posición erecta; al estar de pie (por ejemplo, con muletas), su presión 
bajaba, sufrían mareos y se desmavaban. Para evitar el desmayo, se les continó a 
una silla de ruedas inclinada, que mantiene las piernas en alto, Mediante monito- 
reo constante y bjorretroalimentación de la tensión arterial, Brucker enseñó a va- 
rios pacientes a elevarla, de modo que pudieran adoptar la posición erecta sin des- 
mayarse. La comodidad que ganaron fue muy significativa. 

La biorretroalimentación también se ha utilizado para rehabilitar disfunciones 
musculares que pueden presentarse a raíz de una apoplejía o lesión espinal. Los 
pacientes casi no pueden usar sus manos, brazos, piernas o tobillos; y el movimiento 
pasivo de las extremidades realizado por un fisioterapeuta tiene un limitado valor. 
Pero pueden colocarse electrodos en los músculos parcialmente paralizados de 
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esas extremidades incapacitadas, y proceder al entrenamiento en biorretroalimen- 
tación (Basmajian ef af., 1975; Inglis el al., 1976). Mediante varios “actos de vo- 
luntad”? u órdenes, el paciente intenta mover sus extremidades, y el electro- 
miógrafo (EMG) señala con un sonido el grado en que su músculo parcialmente 
paralizado está activándose. Puede ser que los primeros esfuerzos no produzcan 
movimientos visibles, pero los electrodos son capaces de detectar los potenciales 
musculares y amplificar esas señales para proporcionar al sujeto la biorretroalimen- 
tación que necesita en las etapas iniciales. Mediante el moldeamiento sucesivo, el 
paciente termina por generar potenciales eléctricos mayores en el músculo y des- 
pués en un grupo de músculos relacionados; más tarde mueve ligeramente su 
extremidad, luego efectúa movimientos más amplios, y por último dirige y contro 
la tales movimientos. En muchos pacientes la rehabilitación fue impresionante en 
el aspecto clínico, y supera con mucho la recuperación esperada en estos casos 
con los métodos tradicionales de fisioterapia. 
Otras aplicaciones clínicas de Ja biorretroalimentación muscular son las siguientes: 


1. Tratamiento de dolores de cabeza por tensión al retroalimentar con el EMG, 
ya sea desde los músculos frontales o desde los de la parte de atrás del cuello, y 
enseñando al paciente a relajarse (Budzynski ef al, 1973). 

2. Tratamiento de la tortícolis espasmádica (donde los músculos de un lado del 
cuello sufren espasmos por periodos prolongados, e inmovilizan a la cabeza sobre 
ese hombro) retroalimentando al sujeto con fluctuaciones menores en el EMG de los 
músculos del cuello, y reforzando los músculos que se contraen a fin de que se re- 
lajen (Brudny et al., 1974). 

3, Tratamiento de la escoliosis, que consiste en una curvatura lateral severa en 
la parte baja de la columna vertebral (adquiere casi la forma de una S), dando al pa- 
ciente retroalimentación continua acerca de la posición erecta mediante un moní- 
tor portátil y un sonido (Dworkin, 1979). 


Los éxitos en estos casos y en muchos otros auguran que la biorretroalimenta- 
ción tendrá un significativo papel en la medicina de rehabilitación. No obstante, las 
técnicas requieren de una comprobación y evaluación cuidadosas, y de control en 
situaciones prácticas (para una discusión acerca de los problemas de la evaluación 
clínica de la retroalimentación, véase Blanchard y Young, 1974). 


Enfermedades psicosomáticas 

Si las respuestas y movimientos autónomos de las vísceras pueden aprenderse 
en virtud de sus valores instrumentales, es posible que se comprendan los 
síntomas físicos de las enfermedades psicosomáticas (Miller y Dworkin, 1977). 
Los psiquiatras se refieren a tales beneficios llamándolos “ganancias 
secundarias”” del síntoma psicosomático. Por ejemplo, si debido a una molestia 
estomacal, a un niño se le permite permanecer en casa en vez de ir a la escuela, y 
se le refuerza para que evite una situación escolar desagradable, puede aprender a 
tener trastornos estomacales “genuinos” cuando desee eludir otra circunstancia 
desagradable o de ansiedad. El mismo análisis podria aplicarse a las palpitaciones 
cardiacas psicosomáticas, desmayos, dolores de cabeza, etc.; como a las personas 
enfermas se les presta atención, el síntoma es recompensado mediante esa defe- 
rencia y por el hecho de escapar de tareas molestas. 
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Un eslabón perdido en esta explicación psicológica consiste en especificar por 
qué se elige un síntoma particular y no otro. Dworkin y sus colaboradores (1979) 
propusieron una hipótesis para explicar el aprendizaje natural de la hipertensión 
esencia). Si una persona que está en una situación desagradable o atemorizante 
incrementa su tensión arterial, esto estimulará el seno carótido, que inhibe el sis- 
tema de activación reticular del cerebro, lo cual a la postre disminuye lo desagra- 
dable de la situación. En suma, se refuerza una elevación de la tensión arterial por 
el hecho de que indirectamente da lugar a una reducción del carácter aversivo de 
una situación. (En circunstancias similares, otras personas aprenden a ingerir un 
barbitúrico o un tranquitizante, y la recompensa es el apaciguamiento de la forma: 
ción reticular.) En apoyo de esta hipótesis, Dworkin y sus colaboradores (1979) 
descubrieron que el elevar artificialmente la tensión arterial de una rata hace que 
el anima] sea menos sensible y muestre menos temor 4 una descarga eléctrica do- 
lorosa; pero este efecto se elimina si los nervios de los receptores de presión en el 
seno carótido y en el arco de la aorta se extirpan por medios quirúrgicos. Por lo 
tanto, la elevación de la tensión arterial reduce el carácter aversivo sólo cuando 
ese cambio inhibe la formación reticular. Éste es el tipo de trabajo de detección 
necesario para que la teoría de los reforzadores naturales de síntomas psicosomá- 
ticos particulares se torne admisible. 

Por supuesto, la identificación de una posible causa histórica de un síntoma no 
resuelve el problema terapéutico de hacer que el paciente abandone ese síntoma 
en favor de conductas más saledables, de manejo y de adaptación social. Ante esa 
tarea, los terapentas de la conducta también disponen de un conjunto de métodos 
para reemplazar los hábitos inadaptados por otros adaptados. 


Mecanismos homeostáticos 

En vista de la naturaleza aprendible de las respuestas autónomas en la totalidad 
del cuerpo y de los órganos internos, cabría suponer que desempeñan una impor- 
tante función adaptativa que ayuda a mantener la homeostasis, es decir, un estado 
interno estable y viable. El cuerpo posee inuchos subsistemas fisiológicos que de- 
ben ajustarse a cambios mutuos; como la mayor parte de las funciones stológicas 
(por ejemplo, el metabolismo basal, la capacidad de la respiración, el funciona- 
miento del corazón y de los riñones) varían considerablemente en el transcurso de 
la existencia humana, la plasticidad o adaptabilidad de los diversos subsistemas es 
necesaria para mantener en equilibrio el sistema completo. 

Se ha propuesto que el aprendizaje instrumental de las funciones autónomas 
tal vez incida en muchos de estos ajustes homeostáticos (DiCara, 1970; Miller y 
Dworkin, 1978). ] 

La idea de que la conducta interviene en la homeostasis es muy familiar. Un ho- 
meostato requiere de un circuito de control por medio del cual la desviación del es- 
tado interno de su situación óptima causa alguna acción correctiva que reduce la 
discrepancia (véase la figura 9,3), Así un animal sediento bebe para restaurar el 
equilibrio del agua, una persona friolenta se pone ropas de lana para calentar su 
cuerpo, y un pez nada hacia aquella corriente que tiene la temperatura idea) y el 
enntenido de oxígeno adecuado. Éstas son respuestas instrumentales que redu- 
cen directamente la discrepancia de lo óptimo, y por ello son reforzadas. El que 
estos reductores de impulso sean reforzadores biológicos tiene una significación 
obvia para la supervivencia del más apto en la evolución. 
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contro) en el control homeostáti- 
co de una función fisiológica, 
como la regulación de la tempe- 
ratura. Las conexiones aprendi- 
das se indican con lineas puntea- 
das (tomada de Miller y Dwor 
kin, 1978). 


Reducción en Respueste 
discrepancia vieceral 


Con la figura 9.3 se ilustra un circuito de control en el que una respuesta es- 
quelética se refuerza y aprende porque restaura la homeostasis mediante su im- 
pacto sobre una respuesta visceral intermedia. Por ejemplo, algunos pacientes 
con taquicardia paroxística (el corazón de pronto late con demasiada rapidez) 
aprenden a controlar esta “discrepancia interna” al respirar a fondo (véase el esla- 
bón 1 en la figura 9.3), lo cual estimula el reflejo inhúbitorio del vago, para descom- 
poner la taquicardia y restablecer el ritmo cardíaco normal. Así el alivio del temor 
alarmante a la taquicardia recompensa la actividad de respirar a fondo. 

El aprendizaje directo de una respuesta glandular, visceral o cardiovascular para 
restaurar la homeostasis se muestra en el eslabón 2 de la Águra 9.3, y éste debe 
ser el método dominante mediante el cual nuestros subsistemas fisiológicos se 
ajustan y se regulan unos a otros. Es admisible que ese aprendizaje visceral ocurra 
mediante la recompensa. 

La noción del circuito homeostático sugiere una interesante perspectiva en tor- 
no de lo que hasta el momento hemos considerado como respuestas condicionadas 
paradójicas. Ya se han identificado seis de ellas, que se enumeran en el cuadro 
9.1. En el saber popular del condicionamiento elásico, la respuesta provocada por 
el estímulo incondicionado supuestamente se transfiere al estímulo condicionado, 
Pero en estos casos paradóiicos, la respuesta al EC es sólo lo contrano a la RIC 


CUADRO 9.1. Ejemplos de respuestas paradójicas condicionadas. Cuando la 
sustancia química (columna izquierda) se inyecta como E! en una 
situación de condicionamiento, la reacción fisiológica inicial 
[columna media) es contrarrestada por una reacción 
compensatoria (columna derecha). Esta reacción compensatoria 
se asocía al £C y es provocada por él. 


Efecto fisiológico Respuesta aprendida 
Agente (E!) (RIC) (RC) 
glucosa hiperglucemia hipoglucemia 
insulina hipoglucemia hiperglucemia 
morfina hipertermia hipotermia 
morfina analgesia hiperalgesia 
atropina inhibe la salivación exceso de salivación 
epinefrina disminuye Ja secreción aumenta la secreción 


gástrica gástrica 
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y, por lo tanto, no podría tratarse de la cuestión simple de sustituir el EC por el El 
químico. Así, la RIC una inyección de insulina es una disminución del azúcar en la 
sangre (hipoglucemia) con la consiguiente debilidad, mientras que la respuesta 
condicionada provocada por una inyección de sustancia simulada en la primera si- 
tuación de la insulina es un aumento del azúcar en la sangre. De modo similar, una 
invección de morfina da lugar a temperaturas corporales elevadas e insensibilidad 
al dolor (analgesia), donde la eventual respuesta condicionada a una inyección falsa 
produce lo contrario: una disminución de la temperatura (el adicto ''se 
estremece””) y mayor sensibilidad al dolor (Siegel, 1978). 

Estas reacciones condicionadas paradójicas parecen, en realidad, reacciones com- 
pensatorias o correctivas emprendidas para eliminar una discrepancia creada por la 
droga usada como El. Por ejemplo, el electo inmediato de inyectar insulina es dis- 
jminir los niveles de glucosa en la sangre; esto hace que el páncreas libere una enzima 
que destruye la insulina, de modo que el nivel de glucosa se eleve de nuevo a lo nor- 
mal, Es probable que esta respuesta del páncreas sea la que se condiciona; conse- 
cuentemente, cuando se aplica una inyección de sustancia simmiada el páncreas libera 
su enzima destructora de insulina, y reduce el nivel de ésta a menos de lo normal y, 
por consiguiente, la cantidad normal de glucosa no es metabolizada. El resultado es la 
hiperglucemia. Asf, si consideramos al ET y sus efectos dentro del sistema homeostá- 
Eco total, las respuestas condicionadas paradójicas son respuestas normales correcti- 
vas o compensatorias en un circuito de retroalimentación que se ajusta al desequilibrio 
causado por el EJ. Es interesante notar que, en estos experimentos, la naturaleza 
compensatoria de las respuestas condicionadas sugiere que Ja recompensa instrumen- 
tal podría moldear el aprendizaje, donde la respuesta compensatoria está directamente 
vinculada al mecanismo que restaura la homeostasis. 

Esta área, que relaciona los ajustes homeostáticos en los subsistemas biológicos 
con el aprendizaje recompensado, es fascinante y promete nuevos descubrimien- 
tos en torno del papel de la evolución en la preinstalación de conjuntos homoestáti- 
cos específicos para dichos subsistemas fisiológicos. Es posible que estos conjun- 
tos estén menos preinstalados de lo que se creía, más bien parece que el cerebro 
posee capacidades generales para aprender cualquier conjunto homeostático que 
equilibre óptimamente a los diversos sistemas, de tal modo que una especie se 
ajuste con facilidad a su relación funcional con el medio ambiente. Sin embargo, 
con gran seguridad y hasta cierto grado, la evolución ha restringido estas capaci- 
dades. Las futuras investigaciones en estas direcciones producirán sustanciosos 
hallazgos. 


Condicionamiento neuronal 


Conjuntamente con estas demostraciones del condicionamiento operante de 
respuestas viscerales y cardiovasculares, han comenzado a aparecer iníormes del 
condicionamiento operante de respuestas neutonales en el cerebro, que se miden 
mediante macroelectrodos que registran poblaciones de células cerebrales, o por 
medio de microelectrodos que registran el disparo de unas cuantas neuronas. Olds 
(1965, 1969) fue uno de los primeros en informar de la alteración de la tasa espon- 
tánea de disparo de células simples en la corteza motora de las ratas, al suminis- 
trar estímulo eléctrico a los lugares del cerebro que sirven como recompensa 
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cuando la tasa de disparo de las neuronas corticales sube por encima de un cri- 
terio preseleccionado. En otras series, se recompensa una reducción de la tasa 
espontánea de disparo de la célula, lo cual produce los cambios apropiados. Se han 
usado procedimientos similares con varias mediciones de la capacidad de respues- 
ta neuronal, incluyendo ondas “theta'” registradas del hipocampo (Blask, 1972), 
espigas en el EEG de la corteza sensoriomotora (Wyrwicka y Sternman, 1968), la 
tasa de disparo de unidades simples en la corteza motora disociada de un grupo 
de músculos que normalmente controla (Fetz y Finocchio, 1971), y la amplitud de 
componentes selectos de la respuesta cortical evocada a un destello de luz (Fox y 
Rudell, 1970). 

La significación de esos resultados todavía está en duda y, de nueva cuenta, se 
debe a algo similar el antiguo argumento de la mediación. La neurona de la cual 
se torra el registro tal vez no sea aquella que aprende, sino más bien: a) una que ire 
terviene en la realización de órdenes referentes para el sistema motor (es decir, 
gran parte del condicionamiento neuronal exitoso se ha llevado a cabo con unida- 
des en la corteza motora); o b) una que recibe retroalimentación sensorial de un 
operante motor que está controlado por las contingencias usuales de reforzamien- 
to. Así, un mono puede alterar un componente de su respuesta evocada a un des- 
tello de luz al desenfocar sus ojos, al dirigirlos hacia un rincón oscuro o al mirar de 
soslayo; por lo tanto, cuando refuerza al mono “por modificar su respuesta visual 
evocada””, quizá el experimentador sólo esté reforzando *“el mirar de soslayo”” de 
una manera excesivamente indirecta. Nuevamente, el uso de preparaciones de cu- 
rare puede ayudar a excluir algunos de estos argumentos de mediación pero el 
razonamiento contrario sólo mueve el lugar de control hacia adentro, y afirma que 
las órdenes eferentes se registran, refuerzan y aprenden. 

En algún punto de tales discusiones es casi seguro que alguien observe que 
estos procedimientos equivalen casi a reforzar al animal tratado con curare por te- 
ner ciertos pensamientos, y es un lugar común aceptado que ciertos pensamien- 
tos (por ejemplo, ¡usiones O fantasías) pueden incrementar su frecuencia de- 
bido a sus consecuencias placenteras. En Black (1972) se encuentra una discusión 
convincente y cuidadosa de estos temas metodológicos de interpretación y signifi- 
cación de la labor en el condicionamiento neuronal. Dicho autor concluye que este 
trabajo es importante para iluminar los procesos cerebrales y sus covariaciones 
conla conducta cerebral, y que la cuestión de la mediación no es tan decisiva cono 
toda una generación de psicólogos nos ha hecho creer. Fue importante sólo en los 
primeros enfrentamientos entre los teóricos del reforzamiento de uno y de dos 
factores. 


Biorretroalimentación y control de las 
ondas cerebrales 


Quizá no sea una coincidencia que las respuestas involuntarias son aquellas que 
normalmente no vemos ni sentimos, mientras que las respuestas voluntarias de 
los grandes músculos esqueléticos están abiertas a nuestra constante inspección. 
Es probable que la ausencia de información continua sobre las respuestas internas 
sea lo que hace que éstas se encuentren más allá de nuestro control volitivo. Des- 
pués de todo, ordinariamente aprendemos respuestas y aprendemos a guiar 
nuestra conducta al observar lo que hacemos, al contemplar sus consecuencias y 
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al realizar los ajustes apropiados. El conocimiento de la respuesta y stes conse- 
cuencias se lleva en lo que denominamos estímulos de retroalimentación, los cuales 
tienen una importancia excepcional en el aprendizaje de movimientos especializa- 
dos. Por ejemplo, nuestra habla norma) puede desequilibrarse seriamente si una 
demora, controlada con instrumentos electrónicos, de alrededor de medio segun- 
do se interpone mediante audifonos entre nuestra pronunciación de una palabra y 
el escucharnos decirla. Comenzamos a tartamudear, a farfullar de una forma 
completamente desorganizada, 

La tesis del moviriento de biorretroalimentación es que muchas conductas inter- 
nas podrían hacerse más discriminables —y en consecuencia aprendibles o 
controlables— si su actividad se retroalimentara con amplificadores a la persona 
consciente. Una aplicación novedosa de esta hipótesis intenta la modificación de 
las ondas cerebrales. El trabajo inicial fue realizado por Kamiya (1962, 1969), 
quien presentaba a un sujeto humano un sonido coro estímulo de retroalimenta- 
ción, cuando su ZEG del cuero cabeliudo mostraba una cantidad de actividad de 
onda alía por encima de un criterio de línea base. Alfa es una onda cerebral de 
alrededor de 8 a 10 ciclos por segundo, que en términos generales se correlaciona 
con el estado subjetivo de desinterés, indiferencia o contemplación interna. La no 
existencia de alfa o su bloqueo se origina cuando la persona cae en un sueño ligero 
(las ondas cerebrales se tornan incluso más lentas), o cuando está muy alerta y 
atenta a algún estímulo externo (las ondas se hacen más rápidas, más desincro- 
nizadas). Kamiya descubrió que después de algunos minutos, a varias horas 
de correlación de un estímulo de retroalimentación con presencia verses ausencia de 
actividad alía, la mayoría de los sujetos aprende a discriminar la presencia versus 
ausencia de se propia alía, sin el sonido externo. Además, si a los sujetos se les 
pedía que produjeran alía (o no alfa), o se les recompensaba por hacerlo, podían 
producir alía (o no alfa) a una taza por encima de la línea base normal. Asimismo 
bay evidencia de que mediante el uso de técnicas similares de retroalimentación 
los sujetos pueden aprender a discriminar y a controlar otros tipos de patrones 
EEG, como las ondas theta. 

También se han realizado estudios del EEG y su control con profesionales expe- 
rimentados de la meditación en las disciplinas zen o en el yoga (Katsamatsu y Hi- 
ral, 1966; Anand el al., 1961). Durante ambas formas de meditación, si no se les 
distrae las personas muestran ondas alfa casi continuas (normalmente asociadas 
con un estado de vigilancia relajada). Si se presenta una señal sensorial externa, 
los monjes zen muestran un bloqueo casi invariante de alía (““excitación'*) a la se- 
ñal; lo notable es que este bloqueo o respuesta de excitación cortical no se hahittie 
con ensayos repetidos en dichos monjes, como sucede con los sujetos humanos 
ordinarios. Los yoguis, por otra parte, son casi insensibles eléctricamente a la es- 
timulación sensorial, y continúan en el estado alfa. Se conoce una variedad de 
otros cambios fisiológicos durante la meditación trascendental, cambios que refle- 
jan una desaceleración general de los procesos metabólicos (Ornstein, 1972). Las 
observaciones del EEG sugieren que una de las cosas que los monjes zen y los yo- 
guis aprenden durante sus años de práctica de la meditación es a mantener el estado 
alía. La segunda inferencia es que podemos apresurar el adiestramiento en me- 
ditación (donde el novicio intenta lograr un estado meditativo mal definido) al pro- 
porcionar retroalimentación EEG a fin de moldear la consecución más frecuente y 
el mejor mantenimiento del estado de onda alfa. 
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Promesas y dudas en torno al control de alía 

Las técnicas de retroalimentación EEG fueron aclamadas como una nueva y po- 
derosa herramienta para ayudar a los individuos a ampliar la extensión de su con- 
ciencia, para aprender más acerca de los estados alterados de conciencia y la for- 
ma de producirlos. Éstos son temas de moda en el movimiento interesado en el 
potencial humano, cuyo entusiasmo se aprecia en un comentario de E. E. Green y 
colaboradores: 


Difícilmente puede exagerarse la importancia que para nuestra cultura tiene esta técni- 
ca, ahora en desarrollo, para incrementar el control voluntario de los estados internos. ... 
Sin forzar la imaginación, las implicaciones a largo plazo y los efectos de una población de 
individuos autorregulados sobre la saciedad podrían tener una incalculable significación 
(1970, págs. 1-2). 


El objetivo de obtener mayor autocontrol de los procesos internos (estados ce- 
rebrales) parece loable, pero sin duda se requiere de cierto cuidado para evaluar y 
colocar en la debida perspectiva los resultados del control alfa. En un artículo de 
Plotkin (1979) se encuentra una profunda crítica de la bibliografía relacionada con 
la retroalimentación alía y su interpretación, 

En primer lugar, la evidencia de los datos sugiere que el control alta puede ser 
algo más que el control inexplícito de los movimientos oculares o del enfoque del 
ojo. La mayor alfa que puede producirse ocurre cuando se está relajado y con los 
ojos cerrados en una habitación a oscuras. Si abrimos los ojos ante una luz morte- 
cina, la actividad alía se bloquea: así, la reducción de tal actividad es mayor con la 
inspección visual de la habitación o con una elevada tensión emocional. Gran parte 
de las primeras demostraciones del control alfa eran deficientes en diversos as- 
pectos: 1. generalmente no controlaban ni medían los movimientos del ojo (ni si- 
quiera si los ojos del sujeto estaban abiertos o cerrados); 2. por lo común no había 
control de la desviación ascendente en el nivel de línea base de la actividad alía, a 
medida que el sujeto se relajaba durante su adaptación a la excitación inicial (y alfa 
baja), causada por estar conectado al aparato experimental; 3. los primeros expe- 
rimentos demostraron una diferencia en la cantidad de actividad alfa en el trans- 
curso de los periodos de instrucción de alfa-sí y alfa-no de la sesión experimental. 
Pero puede producirse una diferencia simple, no al incrementar alfa por encima de 
la línea base normal durante los periodos de alfa-sí, sino al reducir alfa por debajo 
de dicha línea (mediante la exploración visual) en los periodos de alfa-no... Po- 
dría objetarse, además, que las personas ya conocen varias tretas mentales que 
reducen o incrementan la actividad alfa, al menos hasta cierto grado, Para producir 
no-alía, únicamente explore su espacio visual. Para incrementar alfa, tan sólo relá- 
jese, desenfoque sus ojos y mire fijamente a la distancia; imagínese que está mi- 
rando una pared vacía o que sus ojos están cubiertos con mitades de pelotas de 
ping. pong que producen luz difusa no configurada. Así, sólo mediante instruc- 
ciones, la mayoría de las personas son capaces de producir grandes diferencias en 
la cantidad de actividad alfa. Sin tales instrucciones, cabe suponer que el hecho de 
decirle a la persona que aprenda a “mantener el tono encendido”* (que significa 
producir alfa, por ejemplo) es similar a darle un problema mal definido de ensayo y 
error: buscará por todas partes hasta que encuentre algún acto mental cuya ejecu- 
ción encienda el tono y lo mantenga así. ¿Ha aprendido esta persona a “entrar en 
un diferente estado de conciencia'*? ¿Ha aprendido a controlar su estado cerebral? 


Cap. 9 Desarrollos en las teorías conductuales 333 


¿0 solamente aprendió que lo que enciende el tono es el desenfocar sus ojos y mi- 
rer a una pared vacía? 

La evidencia de esta conclusión menos halagadora proviene de un experimento 
bien controlado que realizaron Paskewitz y Orne (1973), quienes intentaron adies- 
trar a varios sujetos durante algunos días para que aumentaran su actividad alfa. 
En primer lugar, descubrieron que si se sometía a prueba a los sujetos en una hia- 
bitación oscura y se les indicaba que mantuvieran los ojos abiertos, no podría pro- 
ducirse ningún aumento alfa por encima de la desviación de línea base, Si se les 
sometía a prueba en un cuarto iluminado, podían aprender a mostrar una dife rencia 
en alfa entre los periodos de 'encendido'” versus '“apagado*”. Sin embargo, la 
mayor actividad alfa obtenida de este modo era apenas la mitad de la que se re- 
gistraba antes del entrenamiento, cuando a los sujetos sólo se les pedía que se 
relajaran y cerraran los ojos. Es decir, el adiestramiento nunca legaba a producir 
que alfa ocurriera sencillamente con los ojos cerrados. En segundo término, la di- 
ferencia en alfa lograda por los sujetos entrenados en la luz desaparecía por 
completo cuando se les sometía a prueba en la oscuridad (con los ojos abiertos en 
ambas condiciones). Por tanto, parece ser que la oportunidad de explorar un cam- 
po visual es un requisito necesario para producir una diferencia alía mediante tal 
adiestramiento. Y es un claro error catalogar esta práctica como entrenamiento 
para una conciencia más profunda de los propios estados cerebrales o diferentes 
niveles de conciencia. Esto último, lenguaje florido, sólo conduce al confuso absur- 
do linqúístico de que cualquier actividad se correlaciona con un estado cerebral 
único o con un estado alterado de conciencia. Pero seguramente se trata sólo de 
una nueva declaración peculiar de la hipótesis estándar de cerebro-conducta, que 
es de escaso interés. 

Los variados éxitos de las técnicas de biorretroalimentación alía son interpreta- 
dos de distinta forma por los creyentes en sus poderes y por quienes dudan de 
ellos. Los primeros sostienen que el aprendizaje real del control alfa y sus benefi- 
cios sólo pueden manifestarse con una práctica diligente y extensa, y que los bre- 
ves intentos en el laboratorio son inútifes. Aunque los escépticos no niegan que la 
situación de retroalimentación alía puede producir una euforia meditativa agra- 
dablemente indiferente, afirman que el efecto tiene poco o nada que ver con las 
ondas cerebrales per se, y que más bien se vincula con las exigencias y expectati- 
vas sociales del sujeto para alterar informes verbales acerca de su estado subjetivo. 
El mismo “rumor del sujeto”” puede producirse al proporcionar retroalimenta- 
ción falsa o de sonido aleatoria independientemente de la actividad alfa de la perso- 
na, siempre que ésta crea que su alfa está controlando el sonido (Plotkin, 1976, 
1979). Las expectativas sociales del sujeto tienen gran importancia en sus expe- 
nencias subjetivas. Por ejemplo, si el sonido fuera a retroalimentar realmente la 
información acerca de alfa, pero se llevara al sujeto a creer erróneamente que el 
sonido estaba midiendo algún aspecto fisiológico sin sentido y oscuro (por ejemplo, 
la razón de conversión oxígena-dióxido de carbono), que él debería intentar 
controlar, entonces el rumor eufórico de la meditación no sería parte de la expe- 
riencia, independientemente de si la persona termina por controlar sus ondas alfa 
ono. La hipótesis de la exigencia social también dispone de una explicación rápida 
de por qué los mejores cambios subjetivos que observan los creyentes en sujetos 
que se entregan al aprendizaje a largo plazo de! control alfa y a su estado alterado 
de ““fotación”” meditativa: cuanto más tiempo pase la persona crédula dedicada al 
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adiestramiento, mayores serán las exigencias sociales y las expectativas persona- 
les que experimentará del deseado rumor eufórico, y mayor será su incomodidad 
al informar de un fracaso. Una posición razonable es que las ondas alfa se correla- 
cionan con la ““inmovilidad imperturbable'”, pero la manera en que la persona in- 
terpreta y reacciona ante ese estado varía mucho con las exigencias sociales y las 
expectativas personales. Así, debería ser posible tomar a la inmovilidad en extre- 
madamente aversiva, al sugerir al sujeto que éste es un signo de que está “'per- 
diendo la cabeza”, : 

En torno a los estudios que intentan reducir los ataques epilépticos mediante el 
control de retroalimentación de Jos ritmos EEG han surgido dificultades de in- 
terpretación similares. Sterman (1973) descubrió que sus pacientes epilépticos 
sufrían menos ataques después de varias semanas de adiestramiento en biorretro- 
alimentación EEG, en el transcurso de las cuales se les recompensaba con ritmos 
EEG de 12-14 ciclos por segundo. Kaplan (1973) halló reducciones similares en 
tales crisis, al recompensar las ondas cerebrales dentro de un rango de 6-12 ciclos 
por segundo. Sin embargo, él no atribuía al éxito de la técnica a los ritmos EEG 
específicos, sino al aprendizaje del relajamiento muscular en todo el cuerpo. Se sabe 
que ese relajamiento se opone a los ataques epilépticos. 

A pesar de los resultados debe notarse que estas investigaciones han sido signi- 
ficativas para alterar nuestras concepciones del autocontrol, de la conciencia, y de 
la naturaleza de los eventos privados. Quizá las reacciones internas, incluyendo 
emociones y otros estados afectivos, nos resulten normalmente difíciles de 
controlar porque por lo general no los observamos ni los discriminamos como ta- 
les; constituyen patrones de estímulos vagos e indiferenciados, Si intentáramos 
hacer discriminables a esas reacciones internas mediante la retroalimentación 
(“ampliar la conciencia interior”'), esto debería incrementar la posibilidad de eti- 
quetar y autocontrolar dichas emociones. Aunque tales procedimientos no 
alterarian de modo apreciable la relación entre la estimulación y el efecto fisiológi- 
co, podrían modificar la relación entre este último y la emoción asociada con él, En 
el caso extremo, podemos concebir un régimen estoico de entrenamiento, en el 
cual seamos capaces de decidir cognoscitivamente cómo reaccionaríamos frente a 
un evento emocionalmente perturbador. 

Una hipótesis interesante es que controlamos sólo aquellas conductas que esta- 
mos en condiciones de discriminar (técnicamente, es posible discriminar una con- 
ducta sj su ocurrencia sirve como E* para conductas posteriores como la de eti- 
quetar), En otras palabras, si no somos capaces de discriminar cuándo estamos 
efectuando algún “acto”” y cuándo no, o si no podemos discriminar algún otro ele- 
mento que controla al primer acto, entonces no nos es posible aprender a con- 
trolar ese acto. Hay dos respuestas viscerales que tienen efectos discriminables 
inmediatos, la micción y la defecación, que la mayoría de los niños controlan de 
modo unifonme y exitosa mediante el reforzamiento social. Nuestra tesis, según la 
cual la discriminación implica control, podría plantearse incluso para respuestas 
esqueléticas. La intuición tras esta hipótesis puede apreciarse si se trata de ense- 
ñar a un niño pequeño a parpadear con un ojo, o si intentamos enseñarnos a no- 
sotros mismos a mover la oreja izquierda (una treta que Neal Miller aprendió a fin 
de comprobar este punto): el mejor procedimiento consiste en pararse frente a un 
espejo y examinarse con cuidado, moldeando mediante la autorrecompensa cual- 
quier pequeño movimiento en la dirección correcta. 
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Para regresar al tema principal, podemos preguntar finalmente si el meditador 
zen o el que mueve la oreja, el buen jugador de golfo el pintor, amplían su concien- 
cia y alcanzan o no un estado superior de conciencia. Tal vez sea mejor hablar de 
cosas como la '"conciencia'* en términos de habilidades (perceptuales, motoras; 
habilidades para describir los propios estados internos, etc.) que a los individuos 
les enseñan las sociedades que emplean contingencias sumamente discriminati- 
vas. Pero éstas son cuestiones que implican una discusión más general de la que 
nos propusimos ofrecer en este libro. 


CONCEPCIONES DE REFORZAMIENTO 
Y NO REFORZAMIENTO 


La relatividad del reforzamiento 


La ley del reforzamiento, o del efecto, es uno de los principios fundamentales 
de la teoría del aprendizaje. Como sabemos es una regla para moldear la conducta 
con el uso de recompensas (reforzadores). Entrenamos a una rata para que pre- 
sione una palanca al proporcionarle un poco de corsida cuando lo hace. Debido a la 
significación esencial del principio se ha intentado estipularlo de una manera gene- 
ral, aunque imprecisa. Una formulación comúnmente aceptada establece que una 
respuesta aprendible seguida de un evento reforzante (estimulo, estado de cosas) 
incrementará su fuerza o su probabilidad de ocurrencia. Los críticas de la ley del 
efecto sostienen que esta formulación no constituye una ley empírica, sino más 
bien una definición de un evento reforzante. Veamos. Si un reforzador se define 
como algo que fortalece una respuesta, por sustitución, el enunciado de la ley se con- 
vierte en éste: una respuesta aprendible seguida de algo que fortalece a uma res- 
puesta recibirá un incremento en ¡su fuerza! Como se advierte, se trata de un ra- 
¿onamiento tortuoso y hueco, Sin lugar a dudas, el principio debe ser algo más que 
h trivia] tautología de que *'una rosa es una rosa es una rosa”, 

La cuestión de si la ley tiene o no un contenido empírico fue considerada por 
Meehl (1950) en un artículo clave: **On the circularity of the law of effect”*. Meehl 
llegó a la conclusión de que la ley posee un contenido empírico, que se refiere a la 
generalidad transituacional de un reforzador. Si descubro que el rascarle la parte 
trasera de las orejas a un perro refuerza su conducta de levantar una pata para sa- 
ludar, entonces la ley del efecto predive que el rascar la oreja también puede usar- 
se para reforzar otros tipos de respuestas caninas: lamer la mano, menear la cola, 
hacer rodar una pelota, traer una vara, etcétera. La ley del efecto se utiliza a modo 
“de definición”* en el descubrimiento inicial de que rascar la oreja es un refor- 
zador; pero se emplea de manera predictiva y empírica cuando el rascar la oreja se 
somete a prueba como reforzador para respuestas posteriores. La nueva formula- 
ción que Meehl realizó de la ley del efecto afirma que todos los reforzadares son 
transituacionales, Una versión equivalente y más comprensible sería: un reforza- 
dor puede emplearse para incrementar la probabilidad de cualquier respuesta 
aprendible. 

El análisis de Meehl eliminó el reproche referido a la circularidad, y los psicólogos 
continuaron con sus trabajos, satisfechos con esta formulación de la ley general del 
efecto, Una de las implicaciones del enunciado de Meehl o de Thorndike es lo que 
puede denominarse clasificación “'absolutista”* de los eventos como reforzantes o 
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no reforzantes. En otras palabras, dado un estado particular del sujeto (sus condi- 
ciones de privación o de entrenamiento pasado), a grandes rasgos podemos dividir 
los eventos de estímulo en dos listas: aquellos que actúan sobre él como reforzado- 
res, y los que no operan así, Una lista de reforzadores comúnmente contiene ele- 
mentos biológicos como comida, agua y contacto sexual para individuos privados de 
ellos, junto con reforzadores aprendidos (secundarios) como dinero, elogio, aproba- 
ción social, atención, dominación, la exclamación verbal “bien”, y una variedad de 
elementos coro la curiosidad o las actividades particulares que satisfacen la nove- 
dad. A partir de esta enumeración parcial, algunos psicólogos intentaron averiguar 
qué tienen en común todos estos elementos reforzantes, cuál es el ingrediente 
esencial que los convierte en reforzadores. Una idea plausible, por ejemplo, fue la 
conjetura de Hull de que todos los reforzadores primarios sirven para reducir im- 
pulsos o necesidades biológicas, y que los reforzadores secundarios como la ala. 
banza derivan su valor de haber estado asociados con muchos casos de reducción 
del impulso, tal vez durante la temprana infancia. Esta suposición al igual que otras 
similares ha sido motivo de múltiples investigaciones y ha dado pie a que se discu- 
tan sus pro y sus contra, El estudiante interesado puede consultar a G. A. Kimble 
(1961), quien proporciona un úti) resumen de las polémicas. 


El principio de Premack 

En este contexto, Premack (1959, 1965) ofreció una reevaluación del reforza- 
miento y de la ley del efecto que aumenta la generalidad de los conceptos. Como 
sucede con muchas concepciones brillantes, el argumento de Premack consiste en 
hacer notar una suposición implícita, contenida en formulaciones anteriores acerca 
de la ley del efecto. Esta premisa implícita es que la respuesta o las actividades 
que habrán de ser reforzadas son neutrales o carecen de valor intrínseco para el 
sujeto. Pero supongamos que adoptamos un punto de vista opuesto, según el cual 
el organismo se dedica a varias actividades (como comer, manipular, jugar, etc.) 
que varlan en su valor intrínseco para él. Imaginemos además que por ciertos me- 
dios hemos logrado clasificar estas actividades en un rango que va desde la más 
apreciada hasta la poco preferida, en el orden de 4, B, C,D,... 

Dado este rango de actividades —y considerado en este sentido general—, 
¿cuál es la manera adecuada de formular la ley del efecto? Premack sostiene que la 
única formulación razonable es la que vincula la relación de reforzamiento con este 
orden de preferencia una determinada actividad puede utilizarse para reforzar 
aquellas de menor valor, pero no las de valor superior, En nuestro ordenamiento 
A>B>C>D, podemos usar B para reforzar a Co D, pero B no refuerza a 4. La 
aceptación de este punto de vista nos limita a un enfoque relativo del reforzamien- 
to. Un evento o una actividad puede usarse para reforzar algunas respuestas, pero 
no otras. C puede reforzar a D pero no a B, aun cuando B es aprendible, como 
descubriríamos si hiciéramos a A contingente de B. Así, no todos los reforzadores 
son transituacionales; un determinado reforzador no puede usarse para fortalecer 
cualquier respuesta aprendible. Más bien, una actividad sólo reforzará aquellos de 
menor valor, y no las de valor superior. 

Una interrogante fundamental es la siguiente; ¿esta revisión de la Jey del efecto 
la hace por completo circular? Si se altera la idea transituacional de Meehl, ¿le 
queda algún contenido empírico a la ley del efecto? Podemos evitar la circularidad, 
pero ahora se requiere de dos observaciones (en vez de una) para hacer una pre- 
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dicción empírica. Si encontramos que la actividad R refuerza a Á y que A refuerza 
aZ, entonces la ley predice que R reforzará a Z. Esa predicción tiene contenido 
empírico y posiblemente sería falsa, de donde se infiere que así podría ponerse a 
prueba la ley propuesta. Los lectores familiarizados con la lógica reconocerán este 
procedimiento como una prueba de la premisa de la transitividad, acerca de la re- 
lación de reforzamiento. Así la ley es comprobable aunque no encontráramos nin- 
guna manera independiente de estimar el valor o la preferencia. 

Un problema central radica en si es posible encontrar o no una forma indepen- 
diente de evaluar la preferencia del sujeto para ordenar un conjunto de activida- 
des. Con los sujetos humanos, una estimación verbal de lo que es agradable o 
atractivo probablemente serviría como índice válido, aunque surge una pequeña 
complicación del hecho de que en ocasiones la gente no se da cuenta (no es cons- 
ciente) de los tipos de eventos que refuerzan su conducta. Pero supongamos que 
deseamos tener algún índice de aplicación amplio, que pudiera usarse con animales 
o con personas no verbales, con deficiencias mentales, etcétera. La búsqueda de 
un índice de tal generalidad constituye un verdadero desafio. En un comienzo Pre- 
mack (1959) propuso que un índice válido de generalidad sería la tasa de respuesta 
(o probabilidad momentánea) en una situación de operante libre, en la cual el suje- 
to dispone libremente de un artículo o de una actividad. Este es un índice 
plausible: cuanto más le agrade una actividad a una persona, con más frecuencia se 
dedicará a ella cuando esté disponible sia restricciones. 

Para ilustrar con un ejemplo concreto, imaginemos que un niño que asiste a la 
guardería ha de evaluar los valores de cuatro actividades: jugar con un billar (8), 
ver una película de caricaturas (P), comer chocolates (D), y clavar en una tabla 
(C). La evaluación consistiría en medir con cuánta frecuencia (mediante la cuenta o 
por tiempo total empleado) se dedica el niño a cada actividad en una habitación de 
pruebas, en la cual las oportunidades de realizar cada actividad se introducen una 
por una y separadamente. Supóngase que las tasas independientes para un niño en 
particular dan el orden de B>P>D>C, desde la más elevada a la más baja. Así, 
predeciríamos que la ocasión de jugar con el billar puede usarse para reforzar o incre- 
mentar la tasa de las actividades P, D, o C; que P puede reforzar aD o aC, pero 
no a B; y que D puede reforzar a C, pero no a P nia B. La situación contingente de 
prueba implicaría alguna actividad que pudiera practicarse con entera libertad; 
cuando ésta se lleva a cabo, la otra actividad queda disponible por un momento, 
pero después ya no. Por ejemplo, en la prueba P>D, los chocolates estarían to- 
talmente asequibles en un lugar. Cuando se comiera uno, se pondría en funciona- 
miento un proyector cinematográfico en otra parte de la habitación, que mostraría, 
por ejemplo, un segmento dde una película de dibujos animados con 30 segundos de 
duración. Se inferiría un efecto reforzante si la tasa de chocolates comidos se 
incrementa por encima de su tasa de línea base cuando se introduce esta contin- 
gencia. Premack (1959, 1963, 1965) ha presentado datos de niños, monos y ratas, 
que indican que las predicciones de este tipo son generalmente exactas, 

En algunos casos, sabemos que el valor relativo de dos actividades o artículos 
puede alterarse si se introducen cambios en las condiciones pertinentes de priva- 
ción. Así, puedo alterar la preferencia relativa del lector por comer en contrapos+ 
ción a dormir, al privarlo de comida o de sueño, respectivamente. Por lo tanto, 
deberíamos ser capaces de invertir la relación de reforzamiento entre dos activi- 
dades al alterar la motivación. Premack (1962) demostró este efecto en ratas 
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usando la ingestión de agua y la acción de correr en una rueda de actividad. La tasa 
de ingestión se modificaba por la privación de agua, y la actividad de correr al pri- 
var a la rata del acceso a una rueda, confinándola a una parte limitada de su vivien- 
da. Si estaba privada de líquido y no de actividad, la ingestión de agua reforzaría la 
actividad de correr, pero no a la inversa. Cuando se le privaba de actividad y no de 
agua, el correr reforzaría el acto de beber, pero no a la inversa. De este modo, la 
relación de reforzamiento era reversible. 

La teoría de Premack tiene las ventajas de ser operacional, generar nuevos ex- 
perimentos y describir muchas actividades sociales usadas como reforzadores hu- 
manos. La aceptación de la opinión de Premack del diferencial de probabilidad del 
reforzamiento la hace poco aconsejable para buscar alguna propiedad esencial de 
Jos eventos reforzantes absolutos (por ejemplo, la reducción del impulso) sm con- 
siderar la actividad a reforzar. 

Las dificultades con la teoría de Premack del diferencial de probabilidad del re- 
forzamiento se hicieron paulatinamente evidentes. Se presentan resúmenes de las 
mismas en artículos de Timberlake y Allison (1974), y de Timberlake (1980), 
quienes proponen una teoría más general para manejar todos los resultados 
congruentes con la teoría de Premack, así como otros que la refutan. Timberlake 
(1980) la denomina teoría del egwilibrio de la ejecución aprendida, mientras que 
Timberlake y Allison (1974) la llamaron teoría de respuesta-privación del reforza- 
miento, 


Teoría del equilibrio 


Regresemos.al procedimiento de evaluación simple de dos actividades; por 
ejemplo, con una rata que escoge libremente entre correr en una rueda de activi- 
dad o beber de una botella de sacarina. Supongamos que W y S denotan la tasa de 
línea base de la ejecución de ambas actividades, expresadas en términos (por 
ejemplo) de duraciones promedio de las dos actividades, por una hora en la si- 
tuación de elección. El experimentador puede instituir una contingencia, en este 
caso restringiendo el acceso a la botella de sacarina y haciéndola asequible sólo 15 
segundos, después de que el animal ha corrido en la rueda durante 15 segundos. 
¿Aprenderá la rata a incrementar su actividad de correr en la rueda para llegar a la 
botella de sacarina? La teoría de Premack implica que esta contingencia aumenta 
Ja tasa de la respuesta instrumental (W) sólo si S supera a Y en la línea base de 
elección libre, Sin embargo, contrariamente a lo que afirma esta predicción, se 
sabe que los animales aprenden a incrementar W para tener acceso a una actividad 
contingente restringida S, aun cuando 5 muestre una tasa de línea base inferior 
que 1” (Timberlake, 1980). En otras palabras, los sujetos incrementan su tasa de 
hacer una cosa muy valiosa si ésta les permite hacer otra de valor bajo, próximo a 
su tasa deseable. Podemos pensar que el animal quiere correr en la rueda y beber 
sacarina en las tasas estables Y y S, y cualquier contingencia que perturbe ese 
equilibrio hará que el animal ajuste su tasa de respuesta instrumental a fin de mo- 
ye las nuevas tasas, WS, en la dirección de sus anteriores valores de línea 

ase. 

Los puntos generales de la teoría del equilibrio pueden graficarse como se ve en 
la figura 9.4, donde ambas tasas de respuesta se trazan sobre los dos ejes; para 
mantener en orden la terminología. la respuesta instrumental es cualquiera que 
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Tasa de Tespuesta instrumental 


sea libremente asequibie (como correr), y cuya ejetución dé lugar a un breve ac- 
ceso a la respuesta contingente (como la de beber). La línea de 45 grados en la 
figura 9.4 describe el programa comúnmente usado de razón l a 1, en donde la uni 
dad 1 de respuesta instrumental permite que el sujeto acceda a la unidad 1 de res- 
puesta contingente. Los diferentes programas de razón conducirían a líneas de 
mayor o menor inchinación. Las tasas de línea base para las dos respuestas se tra- 
zan como un punto (7, C,). Después de imponer el programa contingente la 1, la 
tasa de línea base de la respuesta instrumental 7q, sólo producirá una tasa, C,, de 
la conducta contingente, que es considerabiemente menor que la tasa deseada, 
Co. Á fin de obtener la respuesta contingente en la tasa C, en el programa, el suje- 
to tendría que incrementar su tasa de respuesta instrimental hasta 7,, muy por 
encima de su tasa de línea base deseable, /,. La teoría del equilibrio estipula que 
debe encontrarse algún compromiso, de modo que el sujeto ejecute un poco más 
la respuesta instrumental a fin de aumentar su recepción de la respuesta contin- 
gente por encima de C,. La punta de la flecha indica una posible senda de equilibrio 
(todos esos puntos caen sobre la línea entre las intersecciones indicadas). Este es 
el caso estándar, en el cual el animal aprende a ejecutar una respuesta menos de- 
seada a una tasa superior, y es recompensado mediante el acceso a una actividad 
más deseada. La teoría también predice que cuanto mayor sea el déficit de Cp crea- 
do por el programa, mayor será el cambio en la tasa de respuesta instrumental. 

El programa contrario se muestra en el cuadro superior de la figura 9.5. Aquí el 
punto de línea base (punto) indica que en la situación de elección libre, la respuesta 
instrumenta) ocurre a una tasa superior que la respuesta contingente. Este 
programa prescribe que si el sujeto continúa ejecutando la respuesta instrumental 
ala tasa Ip, será obligado a realizar la actividad contingente a la tasa C,, que está 
muy por encima de su tasa deseada de Cy. Esa contingencia forzada es en realidad 
una contingencia de castigo disimulada; de forma análoga, el castigo prototípico 
obliga al sujeto a Someterse más a algún estado nocivo como la descarga eléctrica 
(actividad contingente) de lo que quiere. La tearía del equilibrio predice que la res- 
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puesta instrumental disminuye cuando se imponen tales contingencias. Así, por 
ejemplo, si una rata en una rueda de actividad accionada por un motor se ve obliga- 
da a correr más de lo que escogería cuando bebe agua cor, sacarina en su tasa de 
línea base, entonces el animal disminuirá su tasa de beber (véase la reseña de Allf- 
son, 1976). Esto es así a pesar del hecho de que para alguna otra respuesta o 
programa, el correr en la rueda podría ser reforzante para la rata. 

Las dos predicciones anteriores no distinguen entre la teoría del equilibrio, de 
Timberlake-Altison, y la teoría de diferencial de probabilidad, de Premack. Sin em- 
bargo, se han identificado varios casos distintivos. Uno de ellos ya se ha men- 
cionado: donde una respuesta contingente de baja probabilidad (por ejemplo, 
correr en la rueda) es restringida por el programa, y la única manera en que el ani- 
mal puede tener acceso de línea base a ella es incrementando su tasa de ejecución de 
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una respuesta de probabilidad elevada por ejemplo, beber sacarina. En la teoría 
de Premack no se espera ningún aumento en la respuesta instrumental en tales 
arreglos, mientras que experimentos recientes muestran sustanciales incremen- 
tos, como lo predice la teoría del equilibrio. Una segunda predicción distintiva de la 
teoría del equilibrio es que deberíamos ser capaces de dismúnuir una respuesta de 
inferior probabilidad al hacer que una de probabilidad superior fuera contingente 
de aquélla mediante algún programa. El programa sólo necesita forzar al sujeto a 
ejecutar Ja conducta contingente de alta probabilidad a una tasa superior que la 
preferida. Ahora se sabe que este arreglo reduce la tasa de la respuesta instru- 
mental. 

Una demostración concluyente en favor de la teoría del equilibrio es la que apa- 
rece en el cuadro inferior de la figura 9.5. Éste muestra, para una y la misma línea 
base, que si la respuesta A refuerza a la respuesta B, o viceversa, puede invertir- 
se tan sólo al cambiar la razón del programa de contingencia. En el programa 1, 
la tasa de respuesta instrumental de línea base, /,, conducirá a un decremento de ta 
respuesta contingente, de modo que la respuesta instrumental se incrementará de 
acuerdo con la predicción de equilibrio. Sin embargo, la razón del programa 2 es 
tal que la tasa de respuesta instrumental de línea base conducirá a un exceso for- 
zado de respuesta a la actividad contingente; por lo tanto, la teoría del equilibrio 
predice que en tal programa la tasa de respuesta instrumental debe disminuir. La 
implicación es que si una actividad contingente dada refuerza o castiga una deter- 
minada actividad instrumental, la primera depende de su razón programada (tasa 
de intercambio). A] invertir la actividad que se considere instrumental y la contin- 
gente, el lector puede inferir la implicación antes enunciada; es decir, para dos 
respuestas Á y B cualesquiera, el que A refuerce a B o que B refuerce a A depen» 
de de la razón de la contingencia. (La enunciación del castigo es exactamente lo 
contrario). Timberlake (1980) y Timberlake y Allison (1974) han reseñado varios 
experimentos que demuestran esa reversibilidad mediante cambios en el progra- 
ma. Estos investigadores proporcionan una evidencia crucial para la teoría del 


equilibrio. 
Otros problemas en la teoría del equilibrio 


El análisis del equilibrio nos ha alejado mucho de la ley empírica del efecto con la 
que comenzamos. Hemos ampliado nuestros horizontes acerca de las relaciones 
del reforzamiento. Al hacer un análisis profundo se advierte que muchos procedi» 
mientos prácticos de reforzamiento usados en el hogar o en ambientes escolares 
operan con base en algo parecido al principio del equilibrio: el privar a un niño de la 
oportunidad de realizar alguna actividad —incluso una de valor medio, como 
dibujar—, se utiliza a menudo para motivarlo y recompensarlo contingentemente 
por algunas conductas de importancia educativa. 

La teoría del equilibrio todavía debe resolver algunas dificultades. Una de ellas 
es el problema de la generalidad; otra es la validez de la tasa de respuesta como 
índice de preferencia. El problema de la generalidad surge cuando observamos 
que en casi todos los estudios del aprendizaje humano la operación reforzante es 
“la información acerca de qué es la respuesta correcta”*. Por medio de sus ins- 
trucciones motivadoras, el experimentador o el profesor han hecho que un evento 
correcto sea reforzante para el sujeto, de modo que no se requiere agregar nada 
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más para promover el aprendizaje. La efectividad de esta operación quizá dependa 
de una larga historia de adiestramiento cultural, en el cua] el hecho de estar en lo 
correcto se ha asociado con el elogio y la aprobación de los padres. Por ejemplo, 
en el caso de niños en edad preescolar, las instrucciones y la información a veces 
no bastan; deben agregarse recompensas materiales (chucherías, estrellas dora- 
das. caramelos) para que los pequeños se dediquen a trabajar en tareas de apren- 
dizaje difíciles. En cualquier caso, no está clara la manera en que la teoría del 
equilibrio cubre, o puede cubrir tal reforzamiento por la sola información. Lo mis- 
mo puede decirse del aprendizaje vicario u observacional (véase capítulo 13). 

El otro problema es la validez general del índice de preferencia de tasa de res- 
puesta. Es difícil obtener mediciones comparables sobre tasas independientes de di- 
ferentes actividades; no basta con dejar que las tasas calculadas dependan de 
unidades arbitrarias que el sistema de registro imponga a la conducta. Concebidas 
en un sentido general, nuestras actividades o interacciones con objetos meta 
varían de múltiples formas: en duración de cada contacto, en tasa de interacción du- 
rante el mismo, en tiempo entre contactos, y no resulta nada claro cómo combinar 
estas características en un solo índice. Consideremos, por ejemplo, las dificulta» 
des de obtener mediciones comparables mediante las cuales se arregle en orden 
de rango cuatro actividades: leer un libro, parpadear, tocar el piano y dormir, En 
conexión con el índice de tasa surgen otros problemas (por ejemplo, se puede 
entrenar diferencialmente con el reforzamiento), y esta propuesta específica pare- 
ce amenazada por incontables dificultades y limitaciones insalvables. 

Un tercer problema menor es que la teoría del equilibrio postula una ausencia 
de interacciones entre diferentes actividades. Así, por ejemplo, sería incapaz de 
explicar un resultado que mostrara que la preferencia relativa entre dos opciones 
(por ejemplo, un helado de vainilla o uno de fresa) se invierte si se agrega un ter- 
cer elemento (por ejemplo, fresas). En algunos juicios humanos relativos a la pre- 
ferencia se han encontrado tales efectos contextuales Tversky, 1977, Tversky y 
Sattath, 1979). 

Las dificultades mencionadas son relativamente menores y no desmerecen el 
atractivo de la teoría del equilibrio, Al mirar en retrospectiva las primeras formula- 
ciones de la ley del efecto debidas a Meehl y a Thomndike, es evidente que se han 
hecho algunos progresos en lo que toca a formular las relaciones de reforzamiento 
de manera más general y válida. : 


No recompensa y extinción 


Junto a los desarrollos en la concepción contemporánea del reforzamiento y la 
ley del efecto, se han producido cambios en la interpretación del no reforzamiento 
y la extinción. Casi la totalidad de esta teoría proviene de Jos trabajos con la no re- 
compensa y la extinción efectuados con animales, aunque se supone que ideas si- 
milares se aplican al menos a ciertos tipos de aprendizaje humano. Algunas in- 
terpretaciones iniciales de la no recompensa de una respuesta antes recompensada 
asignaban a ésta un papel esencialmente pasivo. Como veremos en el capítulo 
11, Tolman suponía que la no recompensa sólo sirve para no confirmar y para de- 
bilitar una expectativa E-R-E,. Thorndike le adjudicaba poca importancia sistemá- 
tica y, en esencia la consideraba como un evento neutral. En la teoría de Hull 
(capítulo 5) se postula que los ensayos no recompensados permiten la acumulación 
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de factores inhibitorios que no son compensados por el aumento correspondiente en 
el potencial de reacción. Las ideas de Hull acerca de la extinción se trabajaron 
de modo fragmentario y nunca se adecuaron a la gran variedad de datos exis- 
tentes. 

Durante los últimos 20 años se han propuesto varias hipótesis acerca de la no 
recompensa y la extinción. La mayor parte de ellas trata de explicar la creciente 
resistencia a la extinción en los animales entrenados con un programa de recom- 
pensa parcial. Es decir, una rata recompensada, por ejemplo, sólo en el 30% de 
sus carreras por un pasadizo recto, persistirá más tiempo corriendo a la caja meta du- 
rante la extinción, que otro animal entrenado con ensayos 100% recompensados. 
Este hecho, complementado con diversos resultados adicionales, representa un 
reto constante para los teóricos. No es que las explicaciones no abunden; es la se- 
lección de las mismas con pruebas experimentales críticas lo que ha demostrado 
ser una tarea exigente, aunque informativa. En el capítulo 5 examinamos también 
Ja teoría de Amsel en torno a la frustración de la no recompensa, y la forma en que 
el reforzamiento parcial aumenta la resistencia a la extinción. En esta sección ana- 
lizaremos la teoría de Capaldi del patrón secuencial de la no recompensa, y el 
modo en que explica los fenómenos de extinción. 


La hipótesis secuencial 


La teoría del efecto de extinción del reforzamiento parcial de Capaldi (1966, 
1967), es una elaboración compleja y refinada de dos ideas anteriores: 

1. La hipótesis de discriminación o generalización, que presupone que los suje- 
tos persistirán en responder siempre que no puedan discriminar la serie de extin- 
ción de una carrera desafortunada de no reforzamientos incrustados dentro de la 
serie de entrenamiento. 

2. La hipótesis de efectos secindarios del estímulo (V. F. Sheffield, 1949), que 
supone que los eventos de recompensa (R) y de no recompensa (NW) en un ensayo 
establecen huellas distintivas de estímulo que persisten durante el intervalo inter- 
ensayo, y son parte del complejo de estímulo en el momento en que ocurre la si- 
guiente respuesta. La hipótesis de los efectos secundarios del estímulo supone 
que durante el entrenamiento de reforzamiento parcial, las huellas persistentes de 
estímulo de los ensayos no reforzados (denotados con E”) se condicionan a la res- 
puesta siguiente debido a las frecuentes transiciones NR (es decir, un ensayo re- 
forzado a continuación de un ensayo no reforzado) y, por consiguiente, los 
estímulos EN que surgen y prevalecen durante la extinción mantendrán la respuesta. 

Capaldi elaboró estas ideas en varias direcciones. En primer término, supone que 
una carrera de k ensayos consecutivos no reforzados establece una huella distintiva 
de estímulo, denotada como E**. Los estímulos E**(k = 1,2,3 ...) forman un 
continuo de estímulo a lo largo del cual habrá generalización de la fuerza del 
hábito, a partir de una serie de ensayos experimentados y condicionados du- 
rante el entrenamiento a otras series de ensayos experimentados en el transcurso 
de la extinción. Cuando una serie de kN-ensayos finaliza con un ensayo reforza- 
do, se acumula un aumento en la fuerza del hábito (véase Hull, capítulo 5) entre el 
Ev yla respuesta instrumental, y la asíntota de ese hábito será más alta mientras 
mayor sea la cantidad de recompensa proporcionada en ese ensayo. En segundo 
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lugar, Capaldi supone que la extinción puede concebirse como la presentación de 
una secuencia de estímulos EY, EN2, E"3,,,, y es formalmente como compro- 
bar la generalización del estímulo: un animal responde a E** durante la extin- 
ción si E”* tiene suficiente fuerza del hábito establecida a lo largo del entrena- 
miento, o prestada mediante la generalización de las series de N vecinas que in- 
tervienen en dicho entrenamiento. En esta perspectiva, las variables significativas 
que caracterizan un programa de entrenamiento de reforzamiento parcial son los 
estímulos E”** particulares que ocurren durante e) entrenamiento, y la frecuencia 
con la que se presentan y se refuerzan en el transcurso del entrenamiento, Estos 
factores determinarán el perfil del hábito asociado con el conjunto de estímulos 
E": al comienzo de la extinción; ese perfil y su generalización de las tendencias de 
respuesta a otros E” encontrados durante la extinción, determinan conjuntamente 
la resistencia a la extinción provocada por un programa dado de entrenamiento. 

A fin de ilustrar estas nociones, examínese la secuencia de 8 ensayos que se 
presentan en el cuadro 9.2. Supóngase que esta secuencia se repite cuatro veces, 
para un total de 32 ensayos de adquisición; después del primer ciclo, puede conce- 
birse que los ciclos ulteriores comienzan con un estímulo E* en el ensayo 1 debido 
al acarreo desde R en el ensayo 8 del ciclo anterior. Las cuatro recompensas 
causan el condicionamiento de la respuesta instrumental a tres patrones: E” (en 
los ensayos 1 y 6), EY3(en el ensayo 8), y E"3 (en el 5). Después de cuatro ciclos 
con estas series, el animal debería tener siete reforzamientos en E" (recuérdese 
que el ensayo 1 del primer ciclo no va antecedido de una R), y cuatro en EM y 
E”, respectivamente. El perfil de los tres hábitos y sus tendencias separadas de 
generalización a otros estímulos E** puede observarse en la figura 9.6. La fuerza 
del hábito por encima de E” es superior al que está por encima de E“ y E", de- 
bido a que tiene más ensayos reforzados. Los estímulos E** están espaciados 
logarítmicamente a lo largo del eje, y se supone que los gradientes de generaliza- 
ción del hábito son lineales en esa escala logarítmica. En esta ilustración, se ad- 
vierte que el hábito generalizado sólo desde E* fue demasiado débil para mantener 
la ejecución en E*50 (en el quincuagésimo ensayo de extinción), pero la generaliza- 
ción del hábito establecido en E*3 lo haría. En general, la resistencia a la extinción 
producida por condiciones dadas de entrenamiento depende de la fuerza aunada al 
hábito, que se generaliza a la derecha de esta gráfica. Cuanto más grande sea la 
longitud V que pueda evocar a la respuesta instrumental, mayor será el número 
de ensayos de extinción en los cuales persista la respuesta. 

Ésta es una perspectiva un tanto nueva acerca de los programas de reforza- 
miento; se ajusta muy bien a los actuales modelos de patrón secuencial del apren- 


CUADRO 9.2. Ilustración del análisis de efectos secundarios del estimulo en una 
secuencia de Y ensayos recompensados (R) y no recompensados (N). 
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Figura 9.6, Diagrama del perfil del hábito para los tres patrones secuenciales refor 
zados que se ilustran en el cuadro 92, y la generalización de estos hábitos a otras 
longitudes de series de N ensayos 


dizaje de probabilidad, como los de Estes (19722) y Myers (1970). Pero la utilidad 
obvia del enfoque es que puede explicar diversos resultados experimentales que 
comparan la resistencia a la extinción a continuación del entrenamiento en los cien- 
tos de variantes de los programas de reforzamiento parcial. En sus artículos 
(1965, 1967) Capaldi revisó la extensión de los resultados, y no es necesario repe- 
tirlos aquí. Sin embargo, podemos adelantar que con un pequeño número de ensa- 
yos de entrenamiento, la resistencia a la extinción es mayor con ocurrencias más 
frecuentes de longitudes-N cortas, y menos ocurrencias de longitudes-N largas 
(manteniendo constante el número de ensayos N), mientras que con muchos en- 
sayos de entrenamiento la mayor persistencia ocurre para aquellos programas que 
tienen las longitudes-N más largas. Capaldi también ha ampliado la hipótesis para 
manejar los efectos de otros eventos en caja meta, como diversas duraciones de 
confinamiento en una caja meta no recompensada, distintas magnitudes de recom-» 
pensa y diferentes demoras de recompensa. Su tratamiento explica el hecho de 
que los animales entrenados con una gran recompensa en cada ensayo mostrarían 
una extinción más rápida que los entrenados con recompensa pequeña, porque 
Eee está más alejado del E” en un gradiente de generalización que el Evemeo», 
Por otra parte, en los programas aleatorios de recompensa-no recompensa existe 
una mayor persistencia en los animales que reciben la recompensa más grande, 
puesto que E" está condicionado en mayor grado por la recompensa grande en las 
transiciones NR. Las transiciones son importantes, ya que los animales que reci- 
ben ciclos repetidos de ensayos de PNG (recompensa pequeña; después nada, a 
continuación una recompensa grande) prueban ser mucho más resistentes a la ex- 
tinción que los que reciben la secuencia inversa GNP (Capaldi y Capaldi, 1970; 
Leonard, 1969). 

Una novedosa'técnica introducida por Capaldi (1966) es el reforzamiento interen- 
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sayo (RIE), mediante la cual se coloca al animal directamente dentro de la caja me- 
ta del pasadizo y se le recompensa. El evento RIE opera dentro de la teoría de 
Capaldi a fin de establecer a la huella de estímulo como el E* para el enSayo si- 
guiente de correr, independientemente de si el ensayo previo ha sido No R. En 
otras palabras, el RTE es una forma de interponer un estímulo diferente justamen- 
te antes de un ensayo dado. Con el RIE se dirigieron varios experimentos inge- 
niosos. Considérese el programa de cinco ensayos RNNMNR que se repite varias 
veces, y permítase que un evento RIE se interponga entre diferentes grupos de 
sujetos, ya sea después del primer, segundo o tercer evento N del ciclo. Un grupo 
contro] no recibe ningún RÍE. La hipótesis secuencial predice que los controles 
serán más resistentes a la extinción, después sigue el grupo que recibe el RÍE con 
posterioridad al primer ensayo N, luego los que lo reciben a continuación del se- 
gundo ensayo N, mientras que la menor persistencia la obtiene el grupo que reci- 
be el RIE después del tercer ensayo N, Se predice este ordenamiento porque el 
RIE interrampe la longitud-N que puede ser condicionada por el R en el ensayo 5 
del ciclo. Los sujetos de control experimentan E*3 en el ensayo 5, y se asocian 
con la respuesta reforzada. Los sujetos que reciben RÍE después del primer ensa- 
yo N tendrán entonces E” en el ensayo 3, E*1 en el ensayo 4, E*? en el ensayo 5 
(véase la tabla 9.2). Los que reciben RIE después del tercer ensayo N tendrán 
E* en el ensayo 5. Así, los grupos difieren en la longitud - N más larga que se con- 
diciona a la respuesta, y su resistencia a la extinción aurnenta cuanto mayor sea la 
longitud- N que ha sido condicionada. 

Un punto en el cual la teoría de Capaldi se desvía de la hipótesis de los efectos 
secundarios, de V. E. Sheffield, se refiere al decaimiento temporal de la informa- 
ción acerca del evento reforzante del ensayo anterior. Sheffield supone que los 
eventos R o N establecen huellas de estímulo relativamente a corto plazo que de- 
caen después de unos cuantos minutos. El problema con esa idea es que no expli- 
ca los efectos del reforzamiento parcial obtenidos con ensayos muy espaciados; 

* por ejemplo, un ensayo cada 24 horas. Por el contrario, Capaldi presupone, que 
una huella del evento R o N previo persiste indefinidamente hasta que el siguiente 
evento que ocurre en la caja meta lo modifica o reemplaza. Para él, los estímulos 
previos R o N están ahora disponibles en algo parecido a una memoria que se re- 
activa cuando se vuelve a colocar al animal en la situación de estímulo de laberinto. 
Así, una forma alternativa de discutir la teoría no consiste en decir que el E" es un 
estímulo que persiste desde un ensayo N previo (por ejemplo, 24 horas antes), sino 
más bien que el E” es un efecto estimulante causado por el sujeto que recuerda 
ahora el evento N del ensayo anterior. En algunos aspectos, esta interpretación 
de la memoria es más heurística que la interpretación de la huella de estímulo. En 
cualquier caso, lo que se necesita es algún mecanismo teórico (**conductor de in- 
formación””) que responda de modo instantáneo a la consecuencia recompensante 
más reciente, que codifique esa información de una manera discriminativa (es aquí 
donde el mecanismo z, falla) y que retenga esa información en el transcurso del 
tiempo hasta el siguiente ensayo. Se requiere de esta retención temporal porque 
gran parte de los fenómenos usuales de reforzamiento parcial (Capaldi y Capaldi, 
3970) ocurren ya sea que los ensayos de entrenamiento sean masivos (uno cada 
15 segundos) o estén muy espaciados (un ensayo por día). Por supuesto, el cons- 
tructo de una memoria para un evento (el sustrato de E? o E”) es un tanto extraño 
al espíritu de la teoría de la conducta E-R. 
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Capaldi (1967) aplica esta hipótesis para explicar una gran variedad de diferen- 
tes fenómenos de la programación, incluyendo el reaprendizaje y la extinción ace- 
lerados que ocurren con bloques múltiples de ensayos de adquisición y de extin- 
ción, los efectos de los patrones de programas y la discriminación de los mismos 
(por ejemplo, alternación doble); los efectos de las variaciones de magnitud y va- 
riaciones en la demora de la recompensa, efectos de contraste debidos a cambios 
en las magnitudes de las recompensas, efectos de distintos intervalos interen- 
sayo (concebidos como componentes del complejo de estímulo), etcétera, La 
teoría también se ha aplicado con éxito al aprendizaje humano de probabilidad y a la 
resistencia a la extinción en ese contexto; se desarrolló y comprobó uu modelo 
matemático que vaciaba los principales constructos de la hipótesis dentro del mar- 
code la teoría estadística del aprendizaje (Koteskev, 1972). El consenso de los ia- 
vestigadores indica que la teoría secuencial es la mejor de las que actualmente 
existen para predecir la resistencia a la extinción producida por la mayor parte de 
los programas de reforzamiento. Sorprendentemente, no utiliza ningún concepto 
de inhibición, frustración o respuestas competidoras; más bien las respuestas se 
detienen durante la extinción porque los estímulos E** se alejan lo suficiente en 
un gradiente de generalización de aquellos condicionados a la respuesta eu el 
transcurso del entrenamiento. Un problema teórico que subsiste es el de combi- 
nar a la hipótesis secuencial, de alguna manera creativa, con los conceptos de no 
recompensa frustrante y cou la inhibición (éstos son efectos innegables), a fin de 
producir una teoría más general y completa del no reforzamiento y la extinción. 


VARIABLES INFORMATIVAS EN EL CONDICIONAMIENTO 


Una opinión que paulatinamente comienza a aceptarse es que para producir con- 
dicionamiento efectivo, induso de la variedad pavloviana simple, se requiere más 
que la mera contigúidad temporal del estímulo condicionado (EC) y del estímulo 
incondicionado (£D). Pero se acumula evidencia de que a fin de que se condicione, 
el EC debe impartir información confiable acerca de la ocurrencia del Ef; ha de ser 
un predictor útil del tiempo, lugar y calidad del El. Además, aun si se predice un 
EC dado, quizá no se condicione al El si su utilidad ya ha sido adquirida por otro 
estímulo redundante, que sea un mejor predictor o que haya tenido una historia 
más larga de exitosas predicciones del E/. Estas observaciones se refieren al con- 
dicionamiento de excitación a indicios que predicen al £7, pero también son apli- 
cables al condicionamiento de la inhibición a los indicios que predicen la ausencia 
del El, en una situación en la cual el E7 ocurría de otra manera. 

El fundamento de estas conclusiones aparece en una notable serie de artículos 
de Rescorla y Wagner (para reseñas, véanse Rescarla, 1972; Rescorla y Wagner, 
1972; Wagner y Rescorla, 1972), en los cuales se estudia el condicionamiento clá- 
sico, usando generalmente la “supresión condicionada” o paradigma de la res- 
puesta emocional condicionada (REC). También desarrollaron ima teoría simple 
pero atractiva a fin de combinar la diversa gama de resultados que ellos y otros in- 
vestigadores encontraron. La noción básica es que la efectividad de un reforza- 
miento para producir aprendizaje asociativo a un estímulo previo no depende del 
reforzamiento mismo, sino de la relación entre el reforzamiento y la consecuencia 
que el sujeto anticipa. Así, una y la misma ocurrencia del E! puede tener ningún o 
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un fuerte efecto de condicionamiento dependiendo de si el organismo lo esperaba 
o no. El principio que se aplica a la excitación debido al hecho de esperar un El es 
extensivo a la inhibición causada por la omisión del Ef. Y si el sujeto anticipa un El 
en un ensayo dado en virtud del aprendizaje pasado respecto a un EC, entonces el 
efecto de reforzamiento del E7 en ese ensayo se altera en lo que toca a otros 
estímulos presentados simultáneamente. La teoría puede enunciarse con mayor 
precisión en los siguientes términos: 


Considérese una situación en la cual un compuesto de estímulo, AX, va seguido 
de un reforzador dado, £1,. Las ecuaciones que se presentan a continuación describen el 
cambio teórico en el condicionamiento a los estímulos componentes, A y X, como 
resultado de uno solo de esos ensayos. V, representa la fuerza asociativa, o cantidad 
de condicionamiento a A, y supuestamente tiene una relación monotónica con mediciones 
dependientes como la probabilidad o la latencia de la respuesta. 


AV, = um Br u— Vad (la) 
AV, = 03 1 — Va (19) 


El parámetro A, representa la asíntota del condicionamiento apoyado por el Ef, aplica- 
do; es El-—dependiente y tiene un subíndice que lo indica. La « y la £ son parámetros de 
tasa de aprendizaje dependiente, respectivamente, de las cualidades del EC y del El 
(Rescorla, 1972, pág. 11). 


El estudio de estas ecuaciones permite observar varios puntos sobresalientes. 
El cambio en el condicionamiento de un indicio dado depende en gran parte de la 
diferencia entre la potencia del El (M) y la fuerza asociativa al compuesto de 
estímulo, denotado Var. Como una primera aproximación, se supone que Var = 
Y, + Vy; es decir, la fuerza del compuesto es sólo la suma de las fuerzas de sus 
componentes. Así, cuanto más pequeña sea la diferencia entre A y Var (cuanto 
mejor se prediga el El), menor será el cambio'AV, resultante de otro pareamiento 
de AX con el Ef. La Vs en esta ecuación puede ser negativa, representando el 
caso de inhibición condicionado. Estas ecuaciones son similares a los operadores 
lineales empleados en la teoría del muestreo del estímulo (véase el capítulo 8) para 
describir cambios en el aprendizaje de ensayo a ensayo. Ahora se considerará la 
aplicación de este modelo a varios casos de interés experimental, 


Bloqueo 

Supóngase que el estímulo A sólo ya ha sido condicionado al El, de modo que 
Y, = A, Al presuponer que V, comienza en fuerza cero, introducimos el compues- 
to de estímulo AX pareado con el mismo Ef. Pero como Vax = Va = »M la 
ecuación incremental (16) para AV, es igual a cero. La predicción es que no ocurri- 
rá ningún condicionamiento al indicio X. Este resultado, sugerido originalmente 
por el trabajo de Pavlov acerca del oscurecimiento de un indicio por otro, ha sido 
muy investigado en fechas recientes (Kamin, 1969b). Se le denomina efecto de blo- 
queo porque la adquisición previa de la asociación A-ET bloquea el aprendizaje ulte- 
rior de la asociación X-Ef en el compuesto AX. Las teorías de la atención selectiva 
reclamaron en su momento este efecto (Trabasso y Bower, 1968). Sin embargo, 
más bien parece deherse a lo “na sorprendente”* de que el El siga a A en el com- 
puesto AX. Si la intensidad de la descarga usada como El se incrermentara entre el 
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entrenamiento Á y el entrenamiento AX, prevalecería un valor más elevado de A, 
de modo que en la ecuación (16) se esperaría (y ahora se encontraría) la aparición 
de algún aprendizaje (V,) al indicio X durante el entrenamiento AX. Este aprendi- 
zaje se evalúa cuando el indicio X se presenta por sí solo después del entrenamien- 
to AX. Supóngase, por otra parte, que la intensidad El disminuye cuando se pre- 
senta AX. Esto hace disminuir a A en la ecuación (15), de modo que AV, será 
negativa por un momento, hasta yue V, + Vx descienda al nuevo valor k, lo cual 
significa que Vx será negativo o inhibitorio cuando se evalúe en combinación con al- 
gún estímulo excitatorio B. Rescorla (1972a) ha obtenido este resultado. 


Entrenamiento concurrente de síros estímulos 

Considérese de nuevo el caso donde ocurren ensayos compuestos AX-ElT, al 
ternando con ensayos AX hay otros en los que sólo ocurre A, y para diferentes su- 
jetos sólo se parea Á con el ET, o no se parea. El modelo predice que el grupo que 
recibe ensayos concurrentes A-El mostrará mucho menor condicionamiento al in- 
dicio X que el otro grupo no pareado, ¿Por qué? Porque los ensayos A-El causan a 
Y, y hacen, por lo tanto, que Y, sea grande, y así, mediante la ecuación (10), re- 
ducen el incremento AV, el condicionamiento del indicio X. 


Extinción por reforzamientos continues 

Mediante la selección sensata de un programa de estímulo, podemos extinguir 
un hábito previo al indicio A al parear el compuesto AX con el £E/. Supóngase que 
la intensidad de la descarga apoya a un A de 1.0, y comenzamos a parear el indicio 
A con el El, aplicando la ecuación (1a) hasta que, por ejemplo, el valor de VA 
aumenta a 0.5. En este punto introducimos un bloqueo de ensayos simples de indi- 
cio X-E] suficientes para lograr Vz = 1. Ahora procedemos a dar unos cuantos en- 
sayos compuestos AX-ET intercalados entre muchos ensayos X-El. En los AX- 
El, tendríamos Vax = Va + Vx = 0.5 + 1.0 = 1.5, de forma que la ecuación (la) 
produce a8(—0.5); por lo tanto, AV, será negativa. De modo que el pareamiento 
de A con un indicio más fuerte X o con ensayos AX-El tiene el efecto de debilitar 
V,, la fuerza asociativa del indicio A. Este tipo de predicción se ha confirmado va- 
rias veces en trabajos de Rescorla (19724) y Kamin (comunicación personal, 
1972). Comprueba la impropiedad total de la teoría simplista de que la contigiidad 
temporal de un EC y un ET es todo lo que se necesita para obtener un fuerte con- 
dicionamiento, 


Correlaciones EC-El 

Los primeros experimentos de Rescorla (1968) demuestran que el condiciona» 
miento de un EC (por ejemplo, un sonido) a una descarga, depende de la probabili- 
dad del EJ en la presencia del EC relativo a la probabilidad del EJ en ausencia del 
EC (cuando la rata estaba sentada en la cámara experimental). Cuanto más alta 
sea la correlación entre el EC y la descarga, mejor será el condicionamiento. Para 
una probabilidad dada El al EC, el condicionamiento discriminativo del EC se 
hacía más pobre al incrementar la probabilidad del Ef en ausencia del EC. En el 
caso extremo nunca ocurrían descargas cuando el EC estaba encendido pero que 
sí sucedían a menudo en su ausencia el EC se convertía en un inkibidor cond+ 
cionado del miedo; se transformaba en una señal para la seguridad más que para el 
peligro. Estos resultados, que aparentemente muestran el efecto de la correlación 
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EC, El, son congruentes con las ecuaciones anteriores de condicionamiento. 
Identifíquese A con los estímmios de fondo de la caja de condicionamiento, y déjese 
que X denote el breve sonido intercalado en la situación, con lo cual conceptual- 
mente se crea un compuesto AX. Cuanto mayor sea la tasa de descarga a A sola 
(en ausencia del sonido), mayor será V,; en consecuencia, con argumentos simila- 
res alos anteriores, menos se condicionará el indicio X por medio del pareamniento 
del compuesto AX con una tasa particular de descarga. Además, si las descargas 
que ocurren en ausencia de X (el sonido) siempre van precedidas por un segundo 
indicio, B (un sonido de ““clic””), entonces B en el compuesto BA recoge algo del 
condicionamiento, al reducirlo de A (el fondo solo), con el resultado de que el indi- 
cio X' en el compuesto XA ahora puede adquirir alguna fuerza asociativa en sus pa- 
reamientos con el EJ. Así, todos estos resultados se ajustan nítidamente. 


Inhibición 

Las ecuaciones (La) y (15) pueden describir la adquisición de propiedades inhibi- 
torias si los Vs negativos se interpretan como inhibidores para la respuesta en 
cuestión. Si el estímulo A solo es condicionado a un Ef, y entonces se extingue (A 
= 0), Y, se incrementará, regresará a cero, pero no se tornará inhibidora. Pero 
supóngase que después de que Á se condiciona, seleccionamos un indicio neutral 
X y presentamos el compuesto de estímulo AX sin reforzamiento. En esta cir- 
cunstancia, tanto A como X pierden fuerza, hasta que la combinación V, + Va sea 
igual a cero. Eso ocurriría cuando Va = —Vx, donde ambas difieren de cero. Así, 
al comparar la consecuencia de la extinción para AX en contraposición a Á sola, en 
el primer caso (pero no en el segundo), esperarfamos que el componente A retu- 
viera alguna fuerza excitatoria (Y, >0) cuando se compruebe solo, mientras que X 
se habrá convertido en un inhibidor condicionado, En ningún caso A se convertiría 
en un estímulo inhibidor. El poder inhibitorio condicionado de X se revelaría por su 
capacidad de disminuir la respuesta cuando se agregue a un estímulo excitatorio 
diferente (por ejemplo, B), en ensayos de prueba BX. Ambas predicciones, la ex- 
citación residual para A y Ja inhibición para .X a continuación de la extinción a A, se 
han confirmado experimentalmente (Waguer y Rescorla, 1972). Además, como lo 
predice la ecuación (14), cuanto más prande sea la fuerza del condicionamiento de 
A en el entrenamiento original, mayor será la inhibición que adquiera X durante los 
ensayos no reforzados con Ax. Incidentalmente, el hecho de que Y se torne inhibi- 
torio durante los ensayos no reforzados a AY hace imposible una teoría que expli- 
que el bloqueo de X' en ensayos reforzados a AX, como debido al hecho de que el 
anima! no le “presta atención”' al indicio redundante agregado, X. La teoría de la 
atención no puede ganar en ambos sentidos. 


Bloqueo inhibitorio 

Ya hemos discutido el bloqueo o alteración del condicionamiento excitatorio. 
También es posible hacer arreglos para bloquear el aprendizaje de propiedades 
inhibitorias mediante:un indicio (Suiter y LoLordo, 1971). En una situación KEC al 
indicio A se le hace primero un inhibidor condicionado en el sentido de que 4 
ocurre sin la descarga en una situación de fondo donde las descargas con frecuen- 
cia aparecen de otra manera. Una vez que A se establece como una señal de segu- 
vidad, el indicio X se introduce en el compuesto AX pareado con la ausencia de 
descarga, en un fondo que de otra forma tiene descargas frecuentes. Sin embar- 
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go, pruebas posteriores revelan que el indicio X no adquiere propiedades imhibito- 
rías en este procedimiento. Su aprendizaje ha sido bloqueado por la presencia del 
indicio inhibitorio redundante A, lo cual es congruente con la ecuación 1 si las Vs y 
la A reciben un signo negativo (nhibitorio). 


Insensifiración de la generalización 

La teoría tradicional del aprendizaje posee una antigua máxima que dice que la 
manera óptima de entrenar una conexión £-R es mediante el reforzamiento direc- 
to de esa respuesta a ese estímulo. Por tradición, el reforzamiento de la respuesta 
a un estímulo similar nunca debería producir niveles más grandes de ejecución para 
un estímulo meta, que el entrenamiento directo con el estímulo meta mismo. Al 
parecer debemos abandonar esta máxima del sentido común, ya que Rescorla 
(1976) ha encontrado ejemplos contrarios, claros y predecibles, casos en los 
cuales el entrenamiento a un estímulo generalizado intensifica más la ejecución a 
un estímulo meta, de lo que hace el reforzamiento para el mismo estímulo meta. 
Este paradójico resultado y las circunstancias que lo producen los predicen las 
ecuaciones (14) y (1D). 

Para comenzar la derivación, reconozcamos que una forma frecuente de conce- 
bir la similitud de dos estímulos es en términos de elementos de estímulo comunes 
o compartidos (véanse las representaciones de Thorndike o de Estes de la simili- 
tud en los capítulos 2 y 8). Así, podríamos representar un estímujo simple —por 
ejemplo, un sonido alto— como un compuesto de elementos de estimulo, denotado 
AX, y otro, como un sonido de tono bajo, como otro compuesto, BX. Aqui, X deno- 
ta los elementos comunes, mientras que Á y B denotan aquellos elementos únicos 
alos dos conjuntos de estímulo. Ahora imaginemos que al condicionar el sonido al- 
toa un £/ de descarga, las ecuaciones (1a) y (15) se aplican a los componentes se- 
parados de A y X de ese estímulo, Con los reforzamientos repetidos de 4X, Y, y 
Vr se incrementarán juntos, hasta que la suma de los mismos sea igual asintótica- 
mente a A, En este punto, V, y V, serán cada uno de alrededor de la mitad de A. 

Si continuáramos reforzando AX desde este punto, sus fuerzas no cambiarían de 
acuerdo con la ecuación (1a) y (16). Pero supongamos que en vez de ello damos 
ensayos con el estímulo generalizado (el sonido bajo, denotado como BA) pareado 
con la descarga. Como B comienza a una fuerza baja, la combinación AX tiene una 
fuerza muy por debajo de A; de modo que por la analogía de la ecuación (la), Vr 
aumentaría, y por la ecuación (1D), V, también se incrementaría durante un bloque 
de ensayos reforzados en BX, Este incremento en V, debería manifestarse cuan- 
do sometiéramos al sujeto nuevamente a prueba en el estímulo original de entre- 
namiento, AX. En esa prueba, la fuerza compuesta V,» (= Y, + Yy) será más alta 
que antes, más elevada incluso que si el sujeto acabara de tener ua entrenamiento 
ampliado sólo en. 4X. En un experimento, Rescorla (1976) encontró exactamente 
este resultado, donde el entrenamiento en un estímulo generalizado (a conti- 
nuación del aprendizaje inicial) producía mayor respuesta condicionada a un 
estímulo meta de lo que había producido el entrenamiento ampliado en el mis- 
mo estímulo meta. 

Otra predicción es que el incremento en la respuesta a AX producido al interpo- 
hr reforzamientos BX es mayor cuanto más pequeña sea la contribución del com- 
ponente X (14) a la ejecución original AX. Una forma de reducir V, consiste en lle- 
var a cabo un entrenamiento original usando ensayos de discriminación entre AX+ y 
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BX-. Con las ecuaciones (1a) y (16), ese entrenamiento de discriminación con- 
duce a un valor elevado para V., uno cercano a cero para Vx, y un valor negativo 
(inhibitorio) para V. Si después de la discriminación damos un bloque de ensayos 
reforzados a BX (el estímulo negativo anterior), deben ocurrir grandes cambios 
en V, y en Y, por la ecuación 1, ya que comenzaron el bloque a un nivel tan bajo. 
De nueva cuenta, este cambio considerable en Vx debería revelarse mediante las 
pruebas finales con el estímulo meta, AX. Rescorla (1976) confirmó exactamente 
esos resultados: el aumento en la respuesta AX inducido por los reforzamientos 
BX interpolados era mayor cuando B.X ya se había Usado camo un estímulo negati- 
vo o no reforzado. El lector debe recordar que las notaciones AX y BX se emplean 
aquí teóricamente para representar lo que en el área experimental son tan sólo 
dos estímulos; es decir, un sonido de tono alto y otro de tono bajo. Pero de acuer- 
do con la teoría Rescorla-Wagner de la ecuación 1, la visión de los “elementos co- 
munes"” de la similitud predice estos paradójicos resultados. 

En un trabajo muy relacionado, Blough (1975) propuso una estructura más ge- 
neral para combinar la teoría Rescorla-Wagner con la concepción de los elementos 
comunes de la generalización a lo largo de un continuo de estímulo. Blough 
sostenía que un continuo de estímulo de una dimensión (como la longitud de onda 
de la luz) podría representarse como una secuencia de conjuntos superpuestos de 
hipotéticos elementos de estímulo, con una distribución de probabilidad normal 
(en forma de campana) de elementos de muestreo cerca del centro del estímulo 
presentado (indicado por el punto del estimulo fisico). Blough empleaba una forma 
generalizada de la ecuación 1 aplicada al condicionamiento de cada hipotético ele- 
mento de estímulo de cada conjunto de estímulo presentado. Aplicaba esta teoría 
para ajustar datos recabados en la respuesta discriminativa de estado estable que 
daban las palomas a luces de colores a lo largo de un continuo de longitud de onda. 
Sus datos mostraban generalización de la excitación y la inhibición, y contraste 
conductua! (un efecto que hemos examinado en el capítulo 7). Este último se mani- 
festaba en “topes”? exagerados de mayor o menor respuesta cerca de un 
**borde”” a lo largo del continuo de estímulo, en los cuales la tasa de reforzamiento 
cambiaba abruptamente desde un valor bajo a uno alto. Los resultados de Blough 
aparecen en la figura 9.7. Los picoteos a las longitudes de onda inferiores de 597 
nm se reforzaban en un promedio de una vez cada doce ensayos, mientras que los 
picoteos en las longitudes de onda por encima de 597 nm se reforzaban en un pro- 
medio de uno de cada tres ensayos. Aunque en general las palomas de Blough 
ajustaban su respuesta a un estímulo de forma gradual dependiendo de su tasa de 
reforzamiento, un aspecto interesante de los datos presentados en la figura 9.7 es 
el tope y depresión en cualquier lado del borde entre las zonas de reforzamiento 
alto y bajo. Estos son efectos de contraste en la ejecución análogos a los de acre- 
centamiento de borde (denominadas bandas Mach) en la psicofísica sensorial (véa- 
se Raílifí, 1965) y se derivan, en este caso, de la generalización de Blough del 
modelo de Rescorla-Wagner. La teoría ajusta todos estos gradientes de generali- 
zación de modo cuantitativo, Es interesante observar que logra su originalidad teó- 
rica a) combinar ideas de varias áreas distintas: la representación que hace la 
teoría del muestreo del estímulo de un continuo de estímulo, la teoría de las inte- 
racciones cercanas entre estímulos de ka psicofísica sensorial, y la teoría Rescorla- 
Wagner del condicionamiento de los elementos dentro de compuestos. La teoría 
logra un ajuste muy impresionante para una variedad de resultados ordenados. 
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5 Provabilidad de | Y er 
retorzamiento = 1/12 )y 
Figura 9.7, Tasas relativas de 1es- 
Probabilidad de puesta de tres palomas a llaves 
relorzamiento = 1/3 fluminadas que varían en Íongi- 
tud de onda, La linea vertical se- 
para los estimulos de reforza- 
miento altos y bajos. Nótese la 
_ depresión y el pico a izquierda y 
570 587 597 606 617 derecha del borde (tomada de 
Longitud de onde del astimuto—NM Blough, 1975). 


Porcentaje de respuesta 


Expectancia, sorpresa y condicionamiento 


Las ecuaciones (14) y (16) proporcionan una descripción económica de muchos 
resultados importantes en el condicionamiento (véanse los artículos citados para 
otros resultados). Es evidente que la efectividad de un pareamiento reforzado de- 
pende de la fuerza de otros indicios presentados simultáneamente en el compues- 
to, Sin embargo, los científicos raras veces se satisfacen con las ecuaciones 
descriptivas; quieren calar más hondo a fin de comprender los procesos o meca- 
nismos psicológicos que subyacen en los fenómenos que las ecuaciones describen. 
Se han formulado varias conjeturas teóricas acerca de los mecanismos que susten- 
tan a la ecuación 1, En un artículo original, Kamin (1969b) presentó la base de una 
buena teoría. En relación con efecto del bloqueo que ya hemos descrito, Kamin 
postula que los animales aprenden mucho sólo acerca de sucesos inesperados, de 
aquellos que los sorprenden; si el sujeto puede predecir lo que va a ocurrir (como 
está en condiciones de hacerlo en la segunda fase del paradigma del bloqueo), en- 
tonces Ro se sorprenderá por el EF, y no aprende nada nuevo acerca de los predic- 
tores de éste. Según dicha hipótesis, el grado de expectativa del El (o su falta de 
sorpresa) es la suraa de sus predicciones a partir del agregado total de indicios que 
preceden al El en un ensayo dado. El término (A — (V, + Vx)) en la ecuación 1 indi- 
ca lo sorprendente del El en un ensayo AX y, ciaramente, el aprendizaje aumenta 
con esta diferencia. 

Para explicar estas cuestiones, Wagner (1978) recurrió a varias ideas de las ac- 
tuales teorías de procesamiento de información de la memoria con el fin de propo- 
ner una teoría que racionalizara la noción de la sorpresa y la ecuación 1. Primero, 
en la teoría de Wagner la expectativa está coordinada con el EC que causa una 
representación (““idea””) del El a recuperar de la memoria de largo plazo del ani- 
mal (MLP), y que se activa en la memoria de corto plazo (MCP). (Véanse las 
teorías acerca de la MLP y la MCP en el capítulo 13.) Wagner presupone que si la 
idea de un evento ya está activa en la MCP en el momento que éste ocurre, en- 
tonces no se produce ninguna repetición (recirculación) para el agregado de even- 
tos EC-El y, por lo tanto, no se lleva a cabo ningún aprendizaje o fortalecimiento 
nuevo para los eventos de este ensayo. Si, por otra parte, el EC no recupera la 
idea del El y la hace entrar en la MCP, entonces la ocurrencia del EJ es sorpren- 
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dente, y la idea-El introducida en la MCP se repetirá con el EC, de modo que se 
forma una asociación EC-El. 

Aunque la teoría de Wagner es plausible en cuanto que el desajuste de la MCP 
determina la intensidad de la repetición (o consolidación), ha sido difícil compro- 
barlo de forma discriminativa, y sólo se ha acumulado evidencia indirecta. Terry y 
Wagner (1975) aparentemente han demostrado que un El inesperado (descarga 
eléctrica) se mantiene durante más tiempo en la MCP que un EJ esperado, lo cual 
sugiere mayor repetición en el primer caso. De modo similar, Wagner, Rudy y 
Whitlow (1973) encontraron que tun evento pavloviario esperado interfiere menos 
con el nuevo aprendizaje de un episodio pavloviano temporalmente adyacente, que 
los eventos inesperados, Su experimento implicaba un episodio a ser aprendido 
(4-ED, seguido inmediatamente en cada ensayo por un evento esperado o por 
uno sorpresivo. El aprendizaje de la correlación A-EF requiere que este evento 
doble se repita y se mantenga durante un tiempo en la MCP. Pero si un evento 
sorprendente interviene pronto, exige atención y obtiene prioridad con el meca- 
nismo de repetición; así, la consolidación del proceso crítico de aprendizaje A-El 
en ese ensayo 5e terminará más rápido por un evento inesperado que por uno es- 
perado posterior al ensayo. Estos són los resultados obtenidos, muy similares a 
los que se encontraron con eventos sorprendentes en la memoria humana. Sin 
embargo, es preferible una prueba más directa de las prermisas de la repetición. 

Como otra confirmación de la hipótesis de Wagner, Terry (1976) descubrió que 
el condicionamiento de un indicio A a un El se demoraba mucho si, justo antes de 
A, se suministraba brevemente un El anterior al ensayo (El-A-ED. En teoría, es- 
ta circunstancia debería demorar al aprendizaje, porque el El anterior al ensayo 
haría que el El se representara en la MCP en el momento en que ocurriera el El 
real, y por esto no habría ninguna repetición de A-El en ese punto, Los experi- 
mentos de control extenso parecen excluir la distracción causada por el El ante- 
rior al ensayo como explicación para la tasa diseunaida de aprendizaje. 


Habituación y memoria de corto plazo 


Es probable que la mejor evidencia para la teoría de Wagner provenga de los ex- 
perimentos acerca de la habituación de un reflejo a un estímulo incondicionado. 
Como vimos en el capítulo 1, la habituación se refiere a la pérdida gradual de la ca- 
pacidad de respuesta a un Ef que se repite asidua y regularmente. Si presupone- 
mos que una presentación EJ hace que una idea del El se active en la MCP y que 
se mantenga por un tiempo (posiblemente al estar asociada con los indicios de fon- 
do), entonces, según Wagner, una presentación posterior del El evocaría una 
amplitud más débil de la respuesta incondicionada (RD, porque la idea del último 
El quizá todavía esté activa en la MCP. Este es el modelo de Wagner de la habi- 
tuación y se ajusta bastante bien a los datos. Explicaría por qué el RI disminuye 
más con las presentaciones masivas repetidas del Ef, por qué hay recuperación 
parcial del RT en el transcurso del tiempo (la recuperación es parcial debido al con- 
dicionamiento de fondo del Rf), por qué la interpolación de estímulos novedosos 
puede liberar una Conexión habituada ET-Rf, por qué la alternancia de los indicios 
de fondo (por ejemplo, la habitación de prueba) libera la habituación de un reflejo, 
y por qué el cambio de un £f que provoca una K/ dada (cambiar polvo alimenticio 
por un ácido débil a fin de provocar la salivación) libera la habituación de la RÍ. La 
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teoría de Wagner también explica el fenómeno de la disminución condicionada de la 
RI (véase el capítulo 3, y Kimmel, 1966). Esto significa que a continuación de los 
pareamientos EC-Ef, la RI al El disminuirá cuando va precedida del EC, pero 
todavía será muy grande si el ET ocurre inesperadamente sin el EC. Esto se pre- 
dice con la premisa de que siguiendo al condicionamiento, el EC hace que una idea 
del EJ ge active en la MCP, de modo que cuando el Ef en verdad se presenta reci- 
be menos reacción y procesamiento. Whidow (1975), un investigador asociado a 
Wagner, publicó otras pruebas de Ja teoría MCP de la habituación. Congruente 
con resultados anteriores acerca de la habituación, Whitlow descubrió que cuando 
se harían sonar pares de tonos, la RI (vasoconstricción) en el segundo tono era 
mayor cuando éste difería en el timbre respecto al primero. Pero el efecto de tono 
igual versus diferente disminuía con el paso del tiempo; también cuando una luz 
distractora y un estímulo vibrador se interpolaban en el intervalo entre los soni- 
dos. 

Esto sugiere que el efecto del tono igual versus diferente dependía de la me- 
moría de corto plazo para el primer tono, y que se olvidaba al aparecer un distrac- 
tor o un intervalo largo antes del segundo tono. Esto es lo esperado por la teoría 
de la habituación de Wagner. 

Así concluimos nuestra breve reseña de la teoría de Wagner, cuya importancia 
reside en vincular varias áreas distíntas: memoria de corto plazo, procesos de re- 
petición, habituación, interferencia y consolidación, y condicionamiento diferen- 
cial de elementos dentro de un compuesto de estímulos de señalamiento, La va- 
riedad de fenómenos que abarca la teoría es atractiva. Sólo cabe esperar la rigurosa 
verificación de estas ideas. 


DESAMPARO APRENDIDO 


A lo largo de esta obra hemos trabajado ton una premisa; el término ““aprendi- 
zaje'” se refiere a que el organismo adquiere conocimientos acerca de las regulari- 
dades de los eventos en su ambiente; que aprende que la presencia o la ausencia 
del evento A se correlaciona temporalmente con la presencia o ausencia del even- 
to B. En el condicionamiento pavloviano, los eventos son presentaciones del EC y 
del Ef, y la dirección de su correlación (positiva o negativa) se traduce en una ex- 
pectativa excitatoria o inhibitoria. En el condicionamiento operante, los eventos 
son Ja ocurrencia de la respuesta instrumental y la presentación de un reforzador o 
castigo. El aprendizaje consiste en la planeación de estas contingencias de eventos 
dentro del cerebro del sujeto, como expectativas que modifican su ejecución, 

Sin embargo, una serie de experimentos realizados por Seligmuan y Maier y sus 
colaboradores sugieren uná presuposición esencial que el sujeto ha de tener a fin 
de que tenga lugar ese aprendizaje. La presuposición es que el sujeto debe creer 
que los eventos críticos están correlacionados, y que pueden aprenderse median- 
te la atención apropiada y el registro de los mismos en la memoria. Lo que Selig- 
man y Maier han demostrado (Maier y Seligran, 1976) es la proposición inversa: 
cuando las consecuencias reforzantes son independientes de las respuestas de un 
organismo, éste aprende exactamente eso; es decir, que conseguirá las mismas 
consecuencias si responde o no, y por ello la respuesta es inútil. Este tipo de 
aprendizaje es metaconocimiento: es una creencia de segundo orden acerca de las 
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secuencias de respuesta-consecuencia; vale decir, que las consecuencias son in- 
dependientes de las respuestas y, por lo tanto, no aprendibles. 

Aunque la posibilidad de que los organismos puedan aprender que las conse- 
cuencias aparecen independientemente de las respuestas instrumentales parezca 
al lego una mera proposición del sentido común, resulta una forma novedosa de 
conocimiento en la teoría del aprendizaje. Además, este conocimiento opera de 
una manera peculiar. Una vez adquirida, la creencia en la no contingencia tiende a 
tener amplios e incluso devastadores efectos sobre el sujeto -n futuras si- 
tuaciones de aprendizaje. Los efectos son motivacionales, cognoscitivos y emo- 
cionales, corno se verá a continuación. 

Un experimento paradigmático fue el que dirigieron Seligman y Maier (1967); 
comprendía dos fases para diferentes grupos de perros. Durante la fase 1, se in- 
movilizaba al perro en una hamaca y se le aplicaban descargas eléctricas dolorosas 
e impredecibles. Algunos animales evitaban la descarga al ejecutar una respuesta 
de oprimir un panel; otros recibían la misma descarga que los primeros, pero no 
podían hacer nada para evitarlas o controlarlas. Durante el primer día, los sujetos 
en la situación de escape presumiblemente aprendían que la descarga era contro- 
lable mediante sus respuestas, mientras que los que permanecían en la situación 
de descarga inevitable aprendieron que sus respuestas no tenían influencia de nin- 
guna clase. 

Durante la fase 2, al día siguiente, cada perro recibía entrenamiento de esca- 
pe-evitación de descarga en una caja con dos compartimientos, donde a la rá- 
pida respuesta a un sonido EC al saltar la barrera divisoria entre los comparti- 
nuentos, siempre seguía la terminación del EC y la evitación de una inminente 
descarga. En esta situación, los sujetos que recibían descargas de las que podían 
escapar en la fase 1 aprendían prontamente a evitar el EC, De modo similar, los 
sujetos de control que no habían recibido descargas durante la fase 1 aprendían 
con rapidez a evitarlas. En contraste, los animales que habían recibido descargas 
inevitables en la fase 1 estaban prácticamente “desamparados” durante la fase 2; 
con frecuencia no saltaban al Otro compartimiento cuando sentían la descarga; 
más bien permanecían inmóviles, la soportaban y gemían. No aprendieron a esca- 
par ni a evitar la descarga. Estos animales estaban severamente debilitados, en 
apariencia incapaces de ayudarse a sí mismos a enfrentar la situación traumática. 
Como su incapacidad para actuar dependía de una historia de exposición a descar- 
gas no contingentes, de las que no podían escapar, el fenómeno se denominó de- 
samparo aprendido (abreviado como DA). 

Investigaciones posteriores demostraron que algo parecido al efecto del desam- 
paro aprendido puede producirse en muchas especies, incluyendo a los seres hu- 
manos, y que ocurre para varias formas de reforzadores apetitivos así como para 
la estimulación aversiva. Es interesante notar que el DA aprendido en una si- 
tuación con un reforzador se transfiere a una segunda situación con un reforzador 
distinto. Por ejemplo, Hiroto y Seligman (1975) descubrieron que después de ha- 
ber sido expuestos a una larga serie de problemas de anagramas sin solución, en 
una segunda tarea los sujetos humanos fracasaban por completo al aprender movi- 
mientos simples de la mano para escapar y evitar un sonido nocivamente alto. 

Maier y Seligrnan (1976) clasifican los efectos DA en tres categorías: motiva- 
cional, cognoscitivo y emocional. El déficit motivacional es el más evidente; los 
animales DA son muy lentos para iniciar cualquier respuesta activa con el fin de 
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conseguir recompensas, escapar o evitar el castigo o la frustración. Se muestran 
dgidamente apáticos; parece que se dan por vencidos y sólo esperan cualquier 
evento que su medio ambiente les depare. 

Los sujetos humanos en el experimento DA de Thornton y Jacobs (1971) sen- 
tían que “no tenían control sobre las descargas, así que para qué intentar evi- 


El débcit cognoscitivo de DA es más sutil, pero aparece mediante los análisis 
apropiados. 

La exposición a reforzadores o castigadores incontrolables crea dificultades 
para el aprendizaje incluso cuando las respuestas ulteriores tienen éxito; el ani- 
mal o la persona DA es poco apta para percibir que acaba de controlar el even- 
to punitivo en un ensayo exitoso. Este déficit era evidente en el trabajo inicial 
que mostraba fracaso en el aprendizaje de evitación de los perros DA. Si por ca- 
sualidad uno de estos perros lograba escapar o evitar la descarga durante la se- 
gunda fase del experimento, a partir de esa experiencia exitosa no aprendía (como 
lo hacían los animales normales) que la respuesta eliminaba la descarga y podía 
controlarla. Sus experiencias DA anteriores, según las cuales cualquier forma de 
respuesta era inútil para eliminar las descargas, parecían dar lugar a una tnterfe- 
rencia proactiva masiva con su aprendizaje actual de que la respuesta puede 
controlar las consecuencias. En otros experimentos, este déficit cognoscitivo 
también quedó de manifiesto en un cambio en la habilidad de los sujetos humanos 
después de tratamientos DA para estimar su grado de control de respuesta sobre 
si una luz roja centellearía o no en un ensayo. 

Los déficits emocionales de los sujetos DA son clínicamente interesantes y se 
asemejan a aquellos que asociamos con el individuo desesperanzado, desanimado 
o completamente frustrado. Los perros DA parecen muy temerosos, introverti- 
dos, pasivos, deprimidos y neuróticos. Los animales que recibían descargas de las 
que no podían escapar y que causan desatnparo aprendido, también tienen severas 
reacciones fisiológicas de estrés, En trabajos recientes, se relaciona el desamparo 
aprendido con el fracaso de los métodos normales de un animal para manejar el 
estrés, Este tema reviste el suficiente interés como para que se lo examine bre- 
vemente. 


El memejo del estrés 

Los animales tienen una compleja variedad de reacciones internas al estrés, Pe- 
ro Jo devastador y debilitante que éste puede ser psicológicamente depende 
mucho de si el animal está en condiciones de prepararse a sí mismo para el estrés 
y si piensa que dispone de alguna forma de manejarlo cuando se presente, Se ha 
identificado la importancia de los mismos factores para determinar, la severidad de 
ls reacciones humanas a las condiciones de estrés social o personal. Los experi- 
mentos de Weiss (19714, 1971b) ilustran estos efectos con ratas que recibían fre- 
cuentes descargas eléctricas durante horas mientras estaban amarradas a una 
mesa. Si las descargas se producen a menudo y en momentos aleatorios e inespe- 
tados, la mayor parte de los animales desarrollan muy pronto úlceras estomacales 
graves. Si la aparición de las descargas se señala mediante un sonido, aparecen 
menos, Se dan menos úlceras no sólo cuando se presenta el aviso, sino cuando la 
rata también puede ejecutar una respuesta simple para evitar la descarga o esca- 
par, Así las cosas, la disponibilidad de una respuesta de manejo parece ser un fac- 
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tor importante para reducir la magnitud del estrés psicológico causado por un 
estrés fisico dado. Desde luego, precisamente esta clase de manejo es la que se 
ha desalentado en los animales que reciben el tratamiento de desamparo aprendi- 
do. Sin embargo, si la ejecución de la respuesta de manejo en sí implica conflicto 
(si a veces conduce a más descargas), la ulceración se presenta de nuevo (Weiss, 
19710). Weiss descubrió que los animales DA con estrés comían y bebían menos 
dentro y fuera de la situación de estrés, defecaban a menudo, perdían peso y se 
mostraban apáticos. El citado investigador también ha.estudiado la fisiología de es- 
tas reacciones y ha descubierto que los animales con una respuesta de manejo dis- 
ponible que alivia el estrés durante un periodo de descargas disminuyen los nive- 
les de corticosterona en la corriente sanguínea y aumentan los niveles de norepi- 
nefrina (un transmisor bioquímico) en el cerebro, cosa que no hacen los animales 
de control sin una respuesta de manejo. En los seres humanos, las drogas que ele- 
van la norepinefrina en la sinapsis están asociadas con la activación y con un estado 
de ánimo eufórico, mientras que la depresión mental se vincula con niveles bajos 
de norepinefrina, de modo muy parecido a los que muestra el animal desamparado 
durante el estrés. 


Depresión clínica y desamparo aprendido 

Al extrapolarlo a la situación psiquiátrica, Seligman (1975) ha considerado al de- 
samparo aprendido como una analogía de la depresión clínica humana, e investigó 
sugestivos paralelismos entre pacientes neuróticos deprimidos y sujetos DÁ en el 
laboratorio. Así, por ejemplo, las personas deprimidas difieren de las no deprimi- 
das en el juicio que tienen de su mivel de control de respuesta sobre los eventos. 
Recientemente, la teoría DA para los seres humanos se ha modificado mediante la 
adición de dos factores: 1. si al sujeto se le dice (o se le hace creer) que el éxito o 
fracaso de sus respuestas en una determinada tarea es cuestión de habilidad o de 
suerte; y 2. si el sujeto siente o no que lo que le sucede está en gran parte bajo su 
control (*'interno'”) o bajo el control del ambiente (*“externo'”). Para la evidencia 
pertinente, véase el artículo de Abramson, Seligman y Teasdale (1978). 

La investigación acerca del desamparo aprendido es interesante por su novedo- 
so enfoque conceptual y por sus claras aplicaciones en la psicología clínica. 
Muchos psicólogos poseen teorías intuitivas o formales del desamparo y el desa- 
liento en los seres humanos, que están estrechamente vinculadas con las ideas 
acerca de las habilidades de manejo, del entrenamiento de la cólera bajo estrés y 
de las formas de superar la depresión (Beck, 1976). Los terapeutas tienen un 
comprensible interés en la manera de curar a las personas del desamparo y en 
cómo impedir que se desanimen cuando su ambiente se vuelva brevemente no 
contingente. Estos temas se han estudiado (Seligman, 1975) en algunas de sus di- 
versas facetas. En las ““curaciones'*, por ejemplo, se hace que el paciente se de- 
dique a alguna forma de práctica guiada abierta o de modelamiento participativo 
con la ejecución exitosa de la respuesta de manejo; la “inoculación preventiva” 
usa dosis saludables de entrenamiento contingente de respuesta controlable antes 
de y entre los turnos cada vez más largos de eventos aversivos no contingentes (o 
ineludibles). 

La teoría del desamparo aprendido ha encontrado cierta resistencia entre los 
teóricos E-R, ya que éstos carecen de explicaciones simples acerca de la manera 
en que un animal adquiere conocimiento transituacional sobre las contingencias de 
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eventos. Así, la teoría E-R podría imaginar que un perro que recibe descargas ine- 
Judibles aprendería que las respuestas A, B y € que ha intentado no le permiten 
terminar enseguida con la descarga. Sin embargo, la teoría £-R no concibe ningún 
mecanismo que permita al perro concluir que todas las respuestas serán inefecti- 
vas, o que las descargas finalizan independientemente de cualquier respuesta. 
Además, la teoría £-R no imagina ningún mecanismo que transfiera esa actitud de 
desamparo a situaciones nuevas, de modo que obstaculice el aprendizaje con 
nuevas respuestas y reforzadores contingentes. 

Las teorías contrarias al DA (Black, 1977; Levis, 1976) se basan en la noción del 
aprendizaje supersticioso de respuestas durante la fase de descarga ineludible 
del experimento de desamparo. Estas respuestas compiten o interfieren con el 
aprendizaje activo de la respuesta de escape o de evitación que el experimentador 
registra en la fase 2 de tales experimentos. (Este es un ejemplo de interferencia 
proactiva; véase el capítulo 6.) Así, por ejemplo, si por casualidad el animal está 
agazapado e inmóvil cuando la descarga ineludible termina en la fase 1, ese patrón 
de respuesta se reforzará y ocurrirá con más probabilidad durante la siguiente 
descarga; en ese momento, la inrnovilización también estará presente cuando ter- 
mine la descarga, y así el condicionamiento de la inmovilidad incompatible se acre- 
cienta con rapidez. Si el agazaparse y el inmovilizarse se aprenden, entonces com- 
petirán con el acto de correr para escapar o evitar la descarga en la segunda fase, 
y así se observaría el efecto DA. Esta concepción predice que los animales que re- 
ciben el tratamiento DA se desempeñarán bien o mal en la segunda fase, depen- 
diendo de la compatibilidad del agazapamiento y la inmovilización con la respuesta 
requerida para la recompensa en la segunda fase. Weiss y sus colaboradores infor- 
maron exactamente de estos resultados (1975); las descargas ineludibles previas 
facilitan el subsecuente aprendizaje de una respuesta mínima que requiere que 
una rata se agache y meta las narices en un agujero, pero interfieren con su apren- 
dizaje subsecuente de un movimiento mayor y más complejo, 

Aunque es plausible, la hipótesis de la respuesta motora no ha sido útil para 
explicar estos resultados. Maier y Seligman (1976) consideran ésta y Otras po- 
sibles hipótesis, y argumentan su punto de vista para la teoría del desamparo 
aprendido. En realidad, esta es una teoría cognoscitivista, que se ocupa de las 
creencias que un animal tiene acerca de la controlabilidad de las consecuencias en 
una clase general de tareas. Como se trata de una teoría cognoscitivista, en sus 
postulados acerca del aprendizaje y la motivación la teoría del desamparo aprendi- 
do concuerda muy bien con otras tendencias cognoscitivistas. 


MODIFICACIÓN DE LA CONDUCTA 


En los últimos años, uno de los desarrollos más significativos dentro de la 
psicología es el avance en la aplicación de los métudos de modificación de la con- 
ducta a muchos problemas de ajuste social y personal. Algunos de estos métodos 
se mencionaron brevemente en los capítulos 3 y 7, en ocasión de examinar los mé- 
todos de la desensibilización sistemática y de administración de contingencia. Los 
métodos de modificación de la conducta se derivan de los principios del aprendiza- 
je, y hasta la fecha se han aplicado a una gran variedad de problemas conductuales, 
desde las neurosis hasta los problemas de ajuste en el salón de clases, en el hogar 
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y en situaciones laborales. Veamos en primer término cómo un conductista conci- 
be al desajuste como enfermedad mental o neurosis. 

Según el conductismo, ¿qué es un neurótico? ¿Por qué clasificamos a una perso- 
na como anormal o mentalmente eníerma? La teoría del aprendizaje (Bandura, 
1969, 1971a; Mischel, 1971) sugiere que este juicio se basa en una comparación 
social de la conducta en cuestión con las normas del grupo social. El neurótico ha 
aprendido a comportarse de maneras que personal, legal o socialmente se des- 
aprueban y se consideran desviadas. Por supuesto, el que una determinada con- 
ducta se juzgue desviada (si muestra o no evidencia de “locura'') depende de las 
normas sociales del grupo que efectúa la comparación (por ejemplo, algunas for- 
mas de asesinato se aprueban durante las guerras). 

La premisa del enfoque conductista es que las personas aprenden hábitos 
neuróticos aprenden a ser extrañas, incluso tristes. Según esta perspectiva, la 
función de la psicoterapia, consiste en eliminar o reemplazar la conducta desviada 
que causa la desdicha. Se dice que esa conducta está controlada por ciertos 
estímulos sociales y contingencias de reforzamiento. Para suprimir las conductas 
desviadas (o para sustituirlas con conductas aprobadas), el terapeuta debe en- 
contrar los estímulos o reforzadores de control, y eliminarlos o modificarlos con el 
fin de extinguir las conductas desviadas o que las conductas aprobadas se fortalez- 
can en lugar de las primeras. El objetivo inmediato de la terapia debería ser cam- 
biar directamente la conducta desviada. 

Esta estrategia general se denomina modificación de la conducta o terapia de la 
conducta, y comienza a convertirse en un enfoque dominante de la conducta dese- 
quilibrada en la psicología clínica (Bergin y Garfield, 1971; Leitenberg, 1976). En 
la actualidad se emplea ventajosamente en el tratamiento de todo tipo de des- 
equilibrios conductuales, en toda clase de poblaciones y situaciones institucionales. 
Algunos ejemplos de problemas tratados son la depresión, las fobias, las obse- 
siones, la drogadicción, el mutismo, el retraimiento, la hiperactividad, la auto- 
destrucción, la ecolalia, la enuresis nocturna, los desórdenes en la alimentación; 
rabietas, tartamudeo, vómitos excesivos, insomnio, deficiencias sociales en niños 
autistas, hostilidad y habla extravagante. Y la lista es incompleta. De modo simi- 
lar, los programas de tratamiento conductual se aplican en la psicoterapia indivi- 
dual y de grupo, en la administración de salas psiquiátricas, en prisiones, en hoga- 
res para delincuentes juveniles, en instituciones para niños retrasados mentales, 
para sordomudos y para niños mentalmente desequilibrados; en las guarderías in- 
fantiles, en las escuelas primarias, en el hogar, etcétera. El procedimiento es 
simple y consiste en disponer contingencias para dejar de recompensar la conduc- 
taindeseable y comenzar a reforzar las conductas deseables. Tan prosaico y trivial 
como suena, el hecho es que en situaciones específicas la identificación y el mane- 
jo de las variables relevantes puede ser una cuestión excesivamente sutil que re- 
quiere de cierta preparación técnica. Un problema frecuente es que los agentes 
socialmente importantes (las personas que rodean a un niño) no son conscientes 
de que están reforzando sutilmente la conducta desviada, por lo general con una 
“atención” solícita a la persona cuando ésta se comporta de manera desviada. Un 
niño autista puede golpearse la cabeza contra una pared repetidas veces. Cuando 
lo hace, la enfermera corre hacia él y lo abraza, en parte para impedir que se lastí- 
me. Pero si la conducta reforzante de la enfermera se programa nuevamente, de 
modo que ignore al niño cuando éste se golpee la cabeza, pero le preste atención y 
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lo abrace cuando no lo está haciendo, entonces la frecuencia de golpearse la cabe- 
za se extingue a cero, En la bibliografía referida a la modificación de la conducta se 
citan numerosos ejemplos. 


Características de los programas de 
modificación de la conducta 


Las notas sobresalientes de la terapia de la conducta como modo de tratar des- 
órdenes provienen de sus firmes raíces en las teorías conductistas del aprendizaje, 
más que del modelo intrapsíquico, psicodinámico, difundido por Freud y los psico- 
analistas. La conducta desviada no ha de explicarse recurriendo a motivos profun- 
dos, conflictos y rasgos de la personalidad, sino por los hábitos que la persona 
adquiere a partir de sus experiencias sociales y su historia de reforzamientos. La 
meta de la terapia conductual se especifica en términos de la creación de un nuevo 
aprendizaje, ya sea al enseñar conductas prosociales que antes estaban ausentes o 
al reemplazar (o eliminar) las conductas antisociales O desviadas. Esto contrasta 
con las metas de la terapia psicodinámica. que consisten en ayudar al paciente a 
discernir acerca de sus conflictos inconscientes, a hacer que se sienta íntegro de 
nuevo y a estimular el desarrollo psíquico. 

Los terapeutas conductuales tratan al desajuste o la neurosis como un desorden 
de la conducta que es aversivo para el paciente o para quienes lo rodean. Se inte- 
resan principalmente en las conductas problemáticas especificas, y no en una 
descripción abstracta de Jos rasgos de la persona, Porlo tanto, los terapeutas con- 
ductuales dedican largo tiempo a la evaluación objetiva de la conducta problemática 
antes de la terapia y durante su desarrollo, En muchos casos, el terapeuta quiere 
evaluar el problema conductual directamente en el ambiente social del paciente, 
en el lugar donde se suscita el problema, Con este propósito, los modificadores de 
Ja conducta han desarrollado una variedad de técnicas para observar y registrar las 
conductas problemáticas en situaciones de campo. A menudo tratan con personas 
en situaciones laborales o familiares actuales, o con estudiantes en una guardería 
infantil o en el salón de clases. Porreso han ideado formas de medir discretamente 
h tasa de alguna conducta meta en esa situación, y encontrar la manera de modifi- 
car esa conducta sin desequilibrar totalmente el ambiente. A grandes rasgos, los 
pasos de un programa de modificación de la conducta son los siguientes: 


1. Especificar la conducta problemática tan objetivamente como sea posible, 
prestando especial atención a las situaciones en las que la conducta problema se 
presenta con frecuencia y a aquellas en las que se da raras veces. 

2. Encontrar una manera de medir la tasa de frecuencia de una conducta proble- 
mática (lo cual depende de la naturaleza de la misma). 

3. Con la ayuda del paciente y de personas que le son sigrificativas, decidir las 
metas u objetivos del programa de modificación de la conducta, especificados en 
términos conductuales. 

4. Diseñar un plan de intervención para alterar las conductas metas, incrementar 
aquellas que son deseables y disminuir las indeseables; esto generalmente se leva 
a cabo mediante un contrato con el paciente, en el cual se describen las conductas 
deseadas y las contingencias de reforzamiento en térmings que la persona pueda 
entender y con los que esté de acuerdo. 
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5. Después de que el plan de intervención se ponga en marcha, continuar re- 
gistrando la conducta problema y mantener el monitoreo de la ejecución y el 
progreso del pian; si no se logra cambiar la conducta problema, es necesario madi- 
ficar el plan o variar alguno de sus parámetros (por ejemplo, los valores de la re- 
compensa); seguir experimentando hasta que aparezca la conducta deseada. 

6. Una vez que la conducta problema ha cambiado para cumplir con la meta ini- 
cial, comenzaz a eliminar por fases el plan de intervención, y construir la conducta 
de tal modo que pueda inantenerse indefinidamente mediante las contingencias en 
el ambiente natura) y social del paciente. 

7. Después de la eliminación por fases, vigilar durante meses o años, las recal 
das en la conducta problemática de! paciente, y, de ser necesario, proporcionar 
tratamientos rectificadores, 


En cualquier caso determinado puede emplearse sólo un subconjunto de estos 
pasos, pero en principio deberían utilizarse todos. Para cada etapa del proceso se 
dispone de una batería de técnicas y de consejos tendientes a ayudar al practicante 
de la modificación de la conducta. Especificar objetivamente la conducta problema 
a menudo constituye un gran obstáculo, porque los legos no están acostumbrados a 
esta forma de caracterizar las conductas de una persona. Por ejemplo, los padres o 
los maestros acuden a consultar a un terapeuta de la conducta para quejarse de 
que un niño es agresivo o de que no coopera; de que es lento o no presta atención, 
y le pedirán que “lo normalice””, Pero esos rótulos describen inferencias de ras- 
gos, y no conductas, de modo que el conductista necesita que el padre, el maes- 
tro, el paciente y él mismo especióquen el problema en términos de frecuencias de 
conductas-en- situaciones (que conducen a inferencias acerca de la agresividad o la 
falta de cooperación). Entonces, cada una de estas conductas-en-situaciones 
puede observarse, registrarse, y tal vez convertirse en una meta para el cambio 
enel programa de intervención. 

Los problemas de medir y registrar la tasa de alguna conducta meta se han dis- 
cutido mucho, la variedad de las circunstancias de campo a menudo crea dificulta- 
des cuya resolución requiere de cierto ingenio. Las mediciones más comunes son: 
el tiempo previo a la aparición de una conducta meta; su frecuencia por unidad de 
tiempo o por oportunidad para dedicarse a ella; su frecuencia a lo largo de un inter- 
valo de registro especificado; la frecuencia de las muestras temporales durante las 
cuales ocurre: o alguna consecuencia derivada de la conducta (por ejemplo, los 
“aumentos de peso'” se derivan de piezas de alimentos con calorías). Existen téc- 
nicas (Kazdin, 1975) para los registros de muestreo temporal de conductas múl- 
tiples de muchos sujetos (por ejemplo, varios niños en un salón de clases), y para 
verificar la confiabilidad de las puntuaciones. En cualquier programa de modifica- 
ción de la conducta es necesario emplear alguna de estas técnicas de medición 
conductual; las técnicas mismas constituyen uno de los productos tangibles de la 
tecnología conductual. 

El plan de intervención es aquel punto del programa en el cuál los principios 
específicos del aprendizaje se aplican para configurar las conductas deseadas o ex- 
tinguir (o reemplazar) las indeseables. La técnica más común es el reforzamiento 
operante: disponer contingencias para dejar de recompensar las conductas inde- 
seables y comenzar a recompensar las deseables. El cambio puede ser muy simple, 
como el enseñar a un maestro a mostrar aprobación (sonreír, asentir con Ja cabe- 
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za, dar palmadas en los hombros) hacia sus estudiantes cuando le prestan aten- 
ción, y a no hacerlo en caso contrario. El sistema de recompensas puede ser muy 
elaborado; el profesor podría distribuir fichas (fichas de póquer, puntos) de dife- 
rente valor para conductas deseables, y las fichas serían intercambiables por va- 
rios reforzadores de apoyo, como juguetes, tiempo libre para jugar o cara- 
melos, 

Las recompensas se ajustan específicamente a cada candidato. Así, una mujer 
puede recompensarse a sí misma con alguna actividad placentera (leer su libro fa- 
vorito, bucear, bañarse en una tina de agua caliente) sólo si ese día ha fumado me- 
nos cigarrillos que un número meta, Para seleccionar recompensas, las personas 
dedicadas a modificar la conducta utilizan normalmente el principio de Premack. 
Dichas recompensas se hacen contingentes de la ocurrencia de la respuesta de- 
seada, y por eso se dice que tales programas implican administración de contin- 
gencia. 

Los terapeutas de la modificación de la conducta muy pronto descubrieron que 
el mejor administrador de contingencia es el propio paciente, si es que desea co- 
operar en su programa de cambio conductual. Asi, se alistará y entrenará al inte- 
resado acerca de la manera de monitorear y registrar su propia conducta meta 
(por ejemplo, número de alucinaciones por día, cantidad de calorías consumidas), a 
volcarlas en una gráfica y a recompensarse o castigarse a sí mismo si ha cumplido 
o no con la meta fijada para ese día. Los pacientes generalmente intervienen en el 
diseño de) contrato referido al cambio de la conducta, y estipulan lo que deben ha- 
cer para obtener recompensas específicas. También participan en las decisiones 
acerca del cambio de las contingencias, Este entrenamiento en automonitoreo, 
autorregulación y autorrecompensa es terapéutico y benéfico en tanto tiene 
influencia continua mucho tiempo después de que el interesado abandona al tera- 
peuta conductual. 

Más adelante (capítulo 13), se analizarán las premisas teóricas que apoyan estos 
procesos autorreguladores. 


Técnicas familiares de modificación de la conducta 


A continuación examinaremos brevemente algunos métodos de modificación de 
la conducta, que se ilustran con varios ejemplos. Cada uno de ellos se ha aplicado 
ampliamente a situaciones clínicas o de asesoramiento. 


Moldeamiento 

La conducta meta se va entrenando gradualmente al agregar más eslabones a la 
cadena o partes de la tarea. Un ejemplo sería entrenar a un niño retrasado para 
que se vista solo cada vez mejor, al ponerse los pantalones y abotonarse la camisa, 
calzarse los zapatos, atarse los cordones, etcétera. El moldeamíiento también 
implica aumentar gradualmente el criterio para la recompensa, a medida que la 
conducta meta avanza. Así, se puede exigir a un niño que estudie ceda vez más a 
fin de ganar más tiempo para ver la televisión: un levantador de pesas debe levan- 
tar progresivamente más peso en el transcurso de las sernanas; un fumador ha de 
fumar cada vez menos cigarrillos durante cierto número de días para ganar su re- 
compensa. 
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Extinción 

Deben eliminarse todas las recompensas que podrían mantener alguna conducta 
inadaptada, con lo cual disminuye la tasa de esa conducta. Por ejemplo, las ra- 
bietas de un niño disminuyen si sus padres lo aíslan y lo ignoran cuando hace una; a 
un niño problema en un salón de clases se le puede ignorar por completo mientras 
se porta mal, La extinción también se utiliza para reducir el temor o la ansiedad; 
así, una persona con fobia a las arañas inofensivas o a las serpientes puede expo- 
nerse gradualmente a fotografías y situaciones reales que impliquen al objeto temi- 
do, y que, aunque se vean cada vez más amenazadoras, permitan demostrar que 
son inofensivas. Esta gradual comprobación en la realidad se denomina método de 
tolerancia, y su razón fundamental se examinó en los capítulos 3 y 4, El procedi- 
miento puede llevarse a cabo en la imaginación del paciente, sin apoyos externos. 


Reforzamiento de respuestes incompatibles 

Esta técnica elimina una respuesta inadaptada al combinar el no reforzamiento 
para esa respuesta con el reforzamiento para una respuesta alternativa y prosocial 
que explicitamente compite con la inadaptada. Así, el juego agresivo entre los ni- 
ños puede disminuirse si la maestra de la guardería recompensa ostensiblemente 
(mediante atención y aprobación) sólo el juego pacífico y amigable. Á una persona 
que se come las uñas se le puede entrenar a que apriete los puños y se cruce de 
brazos cuando piense en comerse las uñas. Una persona fóbica puede ser entrena- 
da, mediante el relajamiento muscular profundo, a permanecer tranquila cuando se 
expone a una interacción progresivamente amenazante con el objeto o la actividad 
temida. Esta técnica, denominada desensibilización, se basa en un principio de 
contracondicionamiento (veánse los capítulos 3 y 4), que afirma que el relajamien- 
to es incompatible con la ansiedad. 


Modelado 

Es posible que el interesado no sepa cómo ejecutar la respuesta deseada. En ta- 
les casos, puede aprender al observar un modelo competente que establece un 
ejemplo y ejecuta de manera correcta la respuesta meta. El interesado intenta en- 
tonces imitar la conducta del modelo, o igualaria. Tal imitación por observación 
constituye una forma básica de aprendizaje, que examinaremos en el capítulo 13. 
Así, un hombre tímido y poco agresivo puede observar directamente a una perso- 
na que se afirma a sí misma cuando la provocan con un insulto; el hombre inseguro 
podría entonces intentar imitar el drástico tono de voz, el lenguaje corporal y otros 
aspectos visibles de la actitud de la mujer agresiva que observó, 

Un niño asustado por un perro podría perder su temor al observar a un amigo 
que juega con el anima). La conducta modelo puede practicarse abiertamente o en 
privado (en la imaginación del aprendiz). En la práctica abierta, el aprendiz intenta 
tepetir y practicar una parte o la totalidad de la conducta deseada en una situación 
segura (como en el consultorio del terapeuta o en el hogar, frente a un espejo). En 
la práctica privada, trata de verse a sí mismo en detalle mientras ejecuta la con- 
ducta deseada en la situación meta de interés (como la de imponer respeto frente 
a un colega altanero de la oficina). Á menudo se visualizan recompensas encubier- 
tas (de éxito) que siguen a la nueva respuesta deseada. El objetivo de ese ensayo 
conductual es promover la transferencia de la nueva conducta a la situación de la 
vida real. 
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Castigo 

Una respuesta indeseable puede inhúbirse al hacer que el castigo sea contingente a 
ella. Así, al aplicar un sistema de fichas, la mala conducta específica se penaliza con 
pérdidas de fichas o de puntos, En una guardería infantil, la agresión perturbadora se 
reprueba aislando al niño por un tiempo en una **habitación de enfriamiento” aburri- 
da. Un alcohólico que desea abstenerse de la bebida puede ingerir antibuse, una 
droga que le hace sentir náuseas si bebe. Un fumador que desea dejar el hábito 
puede ser obligado a fumar muchos cigarrillos con rapidez en un armario cerrado 
durante 10 a 15 amnutos, hasta que se sienta enfermo con tanto humo y nicotina. 
Una persona obesa que intenta perder peso podría castigarse privándose de un 
bocadillo por la noche, cuando se haya excedido de una ingestión meta de calorías 
durante el día. La contingencia de castigo en tales casos puede reintegrarse en la 
imaginación en el momento del castigo; la persona se dice a sí misma: ““attora me 
estoy privando de esto porque comí demasiado al mediodía*”. El castigo cubierto e 
imaginado se utiliza a menudo para complementar otras técnicas y para suprimir la 
conducta indeseada. Los terapeutas de la conducta son ambivalentes acerca del 
uso del castigo en situaciones clínicas; algunos creen que es muy efectivo en la eli- 
minación de la conducta; otros piensan que es ineficaz y que en formas internas 
tene efectos secundarios indeseables (por ejemplo, el paciente experimenta re- 
sentimiento y aversión por los agentes del cambio). Todos coinciden en que el uso 
ocasional del castigo en casos que pongan en peligro la vida ha recibido severas 
críticas en los medios de comunicación, que han empañado la imagen que el gran 
público tiene de las técnicas de modificación de la conducta. Por lo tanto, muchos 
especialistas evitan usar castigos fuertes en sus programas por razones de 
relaciones públicas: los medios de comunicación los han castigado por utilizar- 
los. 


Centrol de estímulo 

La conducta instigada por indicios puede controlarse al controlar a aquéllos, Así, a 
un fumador cuyo hábito está encadenado a la costumbre de beber café se le puede 
pedir (cuando intente dejar de fumar) que se abstenga del café, A la persona abru- 
mada de estrés se le puede enviar de vacaciones; al adicto a la heroína se le puede 
remitir a un centro de desintoxicación o pedirle que eluda el contacto con sus amigos 
drogadictos. En cada caso, la persona evita indicios ambientales que fomentan la 
conducta problema. Además, es posible que al paciente se le tenga que enseñar a 
discriminar las situaciones apropiadas para una conducta de las que no lo son, lo cual 
es una forma de control de estímuio. Así, un supervisor quizá deba aprender a criti- 
car a sus subordinados sólo en privado y no en público; una persona tímida, qué 
indicios en el semblante de otra persona sugieren que está interesada en vez de des- 
interesada en hablar; un delincuente juvenil acaso tenga que aprender a discriminar 
que las peleas son malas en Ja escuela pero aceptadas en el cuadrilátero de boxeo, y 
que las expresiones gráficas son bienvenidas en el papel pero no en las paredes de 
los edibcios. Existen métodos estándar para el entrenamiento de la discriminación; 
por ejemplo, recalcar y modelar situaciones adecuadas para la respuesta, y contras- 
tarlas con las situaciones inapropiadas, así como entregar recompensas y no recom- 
pensas de modo discriminativo para la conducta apropiada. 

En términos generales, las técnicas de modificación de la conducta que hemos 
indicado resultan muy familiares. El ingenio de los especialistas de la conducta ha 
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consistido en adaptar y aplicar estos principios a las complejidades de los casos 
reales, En ocasiones, cuando un problema emocional se presenta por primera vez, 
el sentido común no parece tener una solución para el mismo, Quizá debido a la 
tendencia del lego a generalizar demasiado los rasgos de la personalidad del pa- 
ciente problema, el caso se presente como un cuadro global, confuso, pesimista y 
contraproducente, La habilidad de quien está capacitado para la conducta reside en 
atravesar esas capas de impresiones erróneas, conclusiones negativas y frustra- 
ciones, y volver a definir el problema en términos de conducta inapropiada, al cual 
se le pueden aplicar programas positivos. El efecto de estas acciones afirmativas, 
que atacan por sorpresa una situación de mucho tiempo de frustración interperso- 
nal y desamparo, tiene un gran valor terapéutico: la esperanza renovada de un 
cambio real galvaniza al paciente y a las personas que lo rodean, y lo ayudan a 
tomar medidas positivas para mejorar la situación. El frecuente resultado de un 
programa de modificación conductual no consiste sólo en que el cliente se supere, 
sino que también mejoren sus relaciones con aquellos que lo rodean (padres, 
IAestros, compañeros). 


Alcance y evaluación de las prácticas 
de modificación de la conducta 


Los procedimientos de modificación de la conducta se han infiltrado y ejercen su 
influjo en prácticamente todos los aspectos de la salud mental comunitaria, desde 
los cursos de automejoramiento o ajuste personal para individuos normales hasta 
terapia intensiva y radical con psicóticos graves o personas patológicamente des- 
equilibradas. Uno de los autores de este libro —el que aparece en primer 
término—- suele dar clases en un seminario en el cual los estudiantes universita- 
rios aprenden y aplican las técnicas de modificación de la conducta para cambiar su 
propio comportamiento o el de algún amigo. Ciertas conductas son de sumo inte- 
rés para los universitarios: mejorar los hábitos de estudio, la concentración, las 
habilidades sociales; blasfemar, beber o fumar menos, ahorrar dinero, perder pe- 
so, hacer más ejercicio, disminuir la ansiedad que traen consigo los exámenes, 
vencer el miedo a la oscuridad, eliminar el temor a las inyecciones, dejar de co- 
merse las uñas y suprimir los tics nerviosos, reducir la depresión y la soledad, et- 
cétera. Los problemas parecen nimios pero tienen una gran importancia personal. 
Los cursos de modificación de la conducta son muy comunes en las universidades, 
y las técnicas se han difundido considerablemente, De modo similar, esos cursos a 
menudo se imparten para el personal de las clínicas psiquiátricas, hospitales, 
centros de orientación vocacional, reformatorios, prisiones, e instituciones para 
retrasados mentales y personas aquejadas de desequilibrios emocionales. Ade- 
más, muchos psicólogos clínicos y psiquiatras están entrenados en el uso de las 
técnicas de modificación de la conducta, así como en procedimientos psicodinámi- 
cos más tradicionales. Los procedimientos de modificación de la conducta se han 
aplicado a todos los problemas psiquiátricos, y las investigaciones en las que se 
comparan métodos diferentes aparecen en revistas como Behavior Therapy, Beha- 
vior Research and Therapy y Joumal of Applied Behavior Analysis. 

¿Es efectiva la terapia de la conducta? La cuestión global se divide en múltiples 
preguntas: con qué otras terapias debería compararse; cuáles tendrían que apli- 
carse y qué padecimientos psiquiátricos; cómo y cuándo debería evaluarse el me- 
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joramiento, etcétera. Las complejidades de estos temas se analizan en un volu- 
men de Kazdin y Wilson (1978), quienes señalan por qué la evaluación global re- 
sulta difícil (por ejemplo, la expresión “'terapia de la conducta”? no designa un tipo 
uniforme de tratamiento). Sin embargo, con las calificaciones y los límites debidos, 
se puede llegar a la conclusión de que la terapia de la conducta es muy eficaz en el 
mejoramiento de la salud mental de los pacientes, tanto en su propio terreno como 
en comparación con terapias no conductuales. Las características distintivas de la 
terapia conductual son las siguientes: 


1. Traducción del problema a términos conductuales y establecimiento de obje- 
tivos conductuales para el tratamiento, 

2. Se pone el acento en el aprendizaje de conducta nueva para mejorar el proble- 
ma presente en vez de intentar descubrir las causas pasadas del comportamiento 
actual. 

3. Enfasis en la intervención explícita en la vida del paciente, instigándolo a que 
altere su ambiente social, disponga nuevas contingencias de reforzamiento; menor 
importancia a la ingestión de medicamentos, a la aplicación de tratamientos de 
choque o a las operaciones en el cerebro. 

4. Se concentra en la evaluación, cambio y monitoreo de las conductas que cons- 
tituyen el problema; la máxima es: “el síntoma es el problema, curemos el 
síntoma”, 

5, Aplicación de cualquier técnica terapéutica que parezca adecuada, modifican- 
do aquellas que no son efectivas en un caso dado (el terapeuta es responsable de 
ayudar al paciente). 

6. Empleo de profesionales auxiliares o no profesionales del sistema de apoyo 
social del paciente para que lo ayuden en su programa de cambio; la meta consiste 
en cambiar la conducta problema en el ambiente real donde ocurre, no en el con- 
sultorio del terapeuta, 


Estas características contrastan con la concepción que el lego tiene acerca de 
los tratamientos para las enfermedades mentales; la terapia conductual está muy 
alejada del psicoanálisis. En el escenario común del psicoanálisis el paciente se de- 
dica a la asociación libre tendido en el diván del psicoanalista, tratando de des- 
cubrir conflictos reprimidos e inconscientes, y discernir tas raíces de los traumas 
remotos en su vida. Los psicoanalistas esperan que tales discernirientos curen al 
paciente de cualquier síntoma conductual que padezca. Los terapeutas de la con- 
ducta se enfrentan al enfogue psicodinámico y lo discuten prácticamente en todos 
sus aspectos: en la teoría de la enfermedad mental, en sus métodos de evaluación 
(tarjetas de Rorschach versus inventarios de la situación-conducta), y en el conte- 
nido y los métodos de la psicoterapia. La tendencia y la evidencia actuales parecen 
inclinarse claramente por una terapia conductual liberalizada (cognoscitiva). El es- 
tatus cada vez más alto de la terapia conductual en contraposición a la terapia 
psicodinámica tradicional ciertamente ha constituido una de las principales revoin- 
ciones en la psicología, que la teoría conductista del aprendizaje ha fomentado y 
apoyado. Los movimientos más recientes pugnan por una síntesis de los enfoques 
conductual, cognoscitivo y psicodinámico de la neurosis y de la terapia (Goldíried, 
y Davison, 1976; Wachtel, 1977). Sin ingar a dudas, esta es la directriz que guiará 
alos futuros trabajos. 
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OBSERVACIONES FINALES 


Es prácticamente imposible intentar la elaboración de una síntesis que abarque 
todos los ternas examinados en este capítulo, junto con los pronósticos en torna al 
futuro, No sabemos cómo hacerlo, y dudamos que pueda lograrse de una manera 
intelectualmente honesta y, sinembargo, satisfactoria. La tendencia analítica de la 
psicología experimental moderna ha tenido demasiado éxito al descomponer el es- 
tudio del aprendizaje en diversos subcampos y especialidades. Éstas se ocupan de 
sus problemas particulares con dedicación y penetración, pero lo hacen casi inde- 
pendientemente unas de otras. Las modificaciones conductuales producidas por la 
experiencia (aprendizaje) constituyen un gran tema de estudio, en el cual cabe 
esperar la especialización, que incluso puede ser necesaria para que los investiga- 
dores descubran la infinidad de hechos con los que se construye una ciencia 
compleja. Desafortunadamente, aún está lejano el día en que pueda hablarse de 
generalidad completa en psicología, 

Los temas de este capítulo representan sólo algunas de las numerosas tenden- 
cias en la investigación contemporánea dentro de las teorías conductista- 
asociacionistas. Uno de los desarrollos interesantes al que le hemos dedicado 
cierto espacio es el de las aplicaciones prácticas de los principios del aprendizaje a 
los problemas clínicos humanos, como el uso de fa btorretroalimentación en la me- 
dicina conductual, o la terapia de la conducta en el tratamiento de las psiconeuro- 
sis, Aunque estas son aplicaciones de ingemiería de principios básicos, las si- 
tuaciones clínicas de prueba han demostrado ser interesantes por derecho propio, 
y también son muy valiosas al retroalimentar información correctiva para las 
teorías básicas y la experimentación. Una segunda tendencia, en parte pronostica- 
da en este capítulo, es un fuerte movimiento de las teorías del condicionamiento 
hacia una rama cognoscitivista, de estimulo-estímulo, del asociacionismo, para ale- 
jarse de la teoría de estímulo-respuesta. Esta tendencia, que se sugiere en los 
capítulos inictales mediante fenómenos como el precondicionamiento sensorial, la 
memoria de corto plazo en los animales, el automoldeamiento (o rastreo de signo), 
y la teoría Rescorla-Wagner de la asociación, se describirá más profundamente en 
los siguientes capítulos acerca de las teorías cognoscitivistas del aprendizaje. En 
los últimos años, los psicólogos que trabajan en el aprendizaje se han sentido más 
atraídos porla teoría cognoscitivista que por la de E-R. 

El examen de los subiftulos de este capítulo (control voluntario, reforzamiento, 
la ley del efecto, la extinción, las leyes del condicionamiento pavloviano, la habi- 
tuación) a primera vista puede sugerir que los psicólogos han estado ocupándose 
de los mismos antiguos problemas casi desde que su profesión fue reconocida. Un 
crítico interpretaría esta circunstancia de forma negativa, en el sentido de que no 
se ha progresado en la solución de estos problemas, ya que todavía persisten. La 
observación puede ser correcta, pero la interpretación no lo es. Cada uno de los 
términos que empleamos tiene un alcance considerable y es meramente un 
subtítulo conveniente que resulta útil para clasificar y ordenar el volumen de cono- 
cimientos de investigación, leyes, teorías e hipótesis a pequeña escala que se han 
reunido acerca de una clase particular de fenómenos conductuales, que presu- 
miblemente revelan procesos o capacidades fundamentales de algún organismo, A 
medida que se afinan nuestras técnicas para el manejo y el control de la conducta, 
adquirimos los medios para generar patrones conductuales genuinamente novedo- 
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sos, algunos nunca antes encontrados exactamente de esta forma. Mientras se 
desarrolla el trabajo, la extensión o el alcance de un término antiguo se amplía para 
cubrir nuevos fenómenos. 

En un sentido fundamental, los problemas globales de una ciencia particular ra- 
ras veces cambian, y la noción de que pueden resolverse reswta inaplicable e inge- 
nua. Para citar un ejemplo, “el comprender la naturaleza de la materta”” era un 
problema que Aristóteles planteó a la física, y en la actualidad todavía constituye 
un problema central para la física moderna. Pero miles y miles de pequeñas sub- 
metas se han planteado y han muerto, se han hecho progresos, y éstos a su vez 
han generado y continuarán generando otras submetas, preguntas y búsquedas de 
respuestas. La ciencia es una empresa continúa, sin final, ya que cada buena res- 
puesta habrá de plantear interrogantes más profusdas. Lo que es válido en las 
ciencias físicas se aplica también al estudio de la memoria, la motivación, el olvido 
o cualquiera de los problemas clásicos de la psicología. 

E) juego de la ciencia es infinitamente más complicado que el ajedrez, aunque 
comparte los mismos elementos de habilidad, planeación estratégica y atractivo. 
Un problema general origina muchos subproblemas, cada uno de los cuales a su 
vez da lugar a otros, que se dispersan con rapidez para formar un enorme árbol de 
pequeños problemas, donde ninguno en verdad se termina. Hay pocos criterios 
para evaluar el valor o la importancia de obtener una respuesta parcial a un 
subproblema dado, ya que la meta de la empresa total nunca está claramente defi- 
nida. En el mejor de los casos, el objetivo se concibe en términos de **compren- 
der” el problema o satisfacer muestra curiosidad, Muchas ramas del árbol se 
exploran vigorosamente durante un tiempo y luego se abandonan por falta de sa- 
bisfacciones para el investigador, ya sea porque los resultados se comprendieron 
muy poco o demasiado bien (hasta que aparezcan nuevas dudas). 

¿Cómo puede evaluarse el progreso en ese árbol de investigación que cambia 
continuamente? El tínico criterio que puede aventurarse es la profundidad lógica 
de la búsqueda: el número de subproblernas que se han definido e investigado con 
mayor claridad, o tal vez reemplazado o pasado por alto a fin de investigar proble- 
mas más “fundamentales”, etcétera. Mediante tales criterios, se obtuvo un 
grado considerable de progreso en la investigación del aprendizaje. Estamos abru- 
mados de problemas que no sabe mos cómo resolver, y su número parece multipli- 
carse dianamente. 


LECTURAS COMPLEMENTARIAS 


Los siguientes libros de texto y las colecciones editadas proporcionan resúme- 
nes detallados de distintas tendencias de la teoría de la conducta: 


Black, A. H. y Prokasy, W. E. (dirs.), Clasiccal conditioning 11. Current Theory and res- 
earck, 1972. 

Bower, G. H., (dir), The psychology of learning and motivation, volúmenes anuales. 

Catama, A. C., Learning, 1979. 

Estes, W. K., tdir.), Handbook of learning and cognitive processes, vols. 1-5, 1975-1978. 

Honig. W. K. y Staddon, ]. E. R., (dirs.), Hendbook of operant behavior, 1977. 


370 Primera parte. Teorias asociacionistas 


Leitenberg, E. (dir.), Handbook of behavior modification and behavior therapy, 1976. 
Logan, F. A. y Farraro, D. P., Systematic analyses of behavior, 1978. 

Mackintosh, N. J., The psychology of animal learning, 1974. 

O'Leary, K. D. y Wilson, G. T., Behatior therapy: Application and ouicome, 1975. 
Rachim, H., Behavior and learning, 1976. 
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Teoría de la 


Gestalt 


Durante e) primer cuarto de siglo, en los Estados Unidos las polémicas en el 
seno de la psicología académica se llevaban a cabo principalmente en el contexto 
de la psicología asociacionista. El estructuralismo, el funcionalismo y el conductis- 
mu pertenecían a esta familia de la asociación. Constituyen ejemplos de la Opera- 
ción de una metodología empirista de la ciencia, donde la acumulación de hechos 
supuestamente conduce a una adecuada concepción de la naturaleza. Esta compla- 
cencia fue perturbada por la nueva doctrina de la Gestalt, que influyó en las prime- 
ras teorías estadounidenses del aprendizaje con la publicación de las obras de Wolt- 
gang Kóhler: The mentality of upes (1925), y de Kurt Koffka; The growth of the 
mind (1924). La teoría de la Gestalt había comenzado a desarrollarse en Alemania 
desde que la anunciara Max Wertheimer en 1912, pero estos libros y las visitas de 
Kóhler y Koffka a los Estados Unidos cuando se publicaron, originaron que los psi- 
cólogos estadounidenses se interesaran vivamente en este enfoque, La teoría de la 
Gestalt es uno de los pocos ejemplos de una construcción racionalista en psicolo- 
gía. Los gestaltistas empiezan con ciertas ideas bastante abstractas acerca de la 
naturaleza de la percepción y del pensamiento, y la estructura de la experiencia 
psicológica; pasan entonces a interpretar las observaciones familiares en términos 
de estos nuevos conceptos, y disponen demostraciones sorprendentes de la opera- 
ción de las supuestas fuerzas organizacionales a las cuales se refiere su teoría. 

Debemos recordar que los psicólogos de la Gestalt se interesaban fundamental- 
mente en la percepción y en los procesos de resolución de problemas. Al apren- 
dizaje se le consideraba como un fenómeno secundario y derivado, sin ninguna 
atracción especial; lo que se aprende es producto de las leyes de la organización 
perceptual, y está determinado por ellas; lo que se ejecuta depende de la manera 
en que la mente, utilizando sus prucesos actuales de resolución de problemas, ana- 
liza la estructura de la situación presente y hace uso de las huellas de experiencias 
pasadas. Es fácil ver por qué, can esta orientación, los gestaltistas se abocaron a 
realizar experimentos acerca de la percepción, pero relativamente pocos trabajos 
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relacionados con el aprendizaje per se. A pesar de ello, examinaremos los estudios 
que han efectuado alrededor del aprendizaje. 

Las fuertes tendencias del condicionamiento y del aprendizaje animal de la psi- 
cología estadounidense inicial obligaron a los gestaltistas a emprender sus discu- 
siones y controversias dentro del campo del aprendizaje animal, y en torno a 
los problemas inherentes a su interpretación, que acaparaban la imaginación de los 
psicólogos de aquella época. Por lo tanto, a partir de esta primera importación a 
los Estados Unidos, la psicología de la Gestalt tuvo que defenderse en un tecri- 
torio científico extraño. 

Por ejermplo, los fibros de Koffka y de Kóhler han tenido una importante reper- 
cusión en la teoría estadounidense del aprendizaje, debido a su crítica detallada del 
aprendizaje efectuado por el método de ensayo y error, como Thorndike lo conce- 
bía, una estocaca directa al corazón de la teoría en boga por aquella época. El vigo- 
roso ataque a Thorndike (y al conductismo) se sustentaba en los experimentos 
bien conocidos de Kóhler con monos, que se describen detalladamente en su libro. 
La obra de Kóbhler puso en primer plano la noción del aprendizaje por discerni- 
miento como una opción al método de ensayo y error. Dernostró la forma en que 
los monos podían obtener recompensas sin necesidad de pasar por el laborioso 
proceso de eliminar las respuestas erróneas y registrar las correctas, camo se re- 
quería en las teorías de Thorndike y se mostraba en sus curvas del aprendizaje 
con gatos. Los monos podían usar varas y cajas como herramientas, y también 
desviarse de la meta de la actividad a fin de proveerse de los medios para lograr un 
propósito. 


Los experimentos de Kóhler acerca del discernimiento 


Los experimentos de Kóhler con monos se realizaron desde 1913 a 1917 en la 
isla de Tenerife, frente a las costas occidentales de África, Su libro acerca de es- 
tos experimentos se publicó en inglés en 1925 (Kóhler, 1917) y alcanzó una popu- 
laridad inmediata. Los psicólogos estadounidenses se interesaron en dos series de 
experimentos relacionados con los problemas de discernimiento de que Kóhler in- 
formaba: los problemas con cajas y los problemas con varas. 

En la situación de una sola caja, por ejemplo, se ataba un plátano como señuelo 
al techo de la jaula del chimpancé, El señuelo está fuera del alcance del mono, pero 
éste puede tomarlo subiéndose a una caja y saltando desde ella. Se trata de un 
problema difícil para el simio, y sólo Sultán (el mono más inteligente de Kóhler) lo- 
gró resolverlo sín recibir ninguna ayuda, mientras que otros seis animales pudie- 
ron hacerlo después de recibir ayuda, ya sea al poner la caja dehajo del alimento 
o luego de observar a otros monos usar la caja. El problema no se solucionó con 
la mera imitación directa. El efecto de observar a otros animales que utilizaban la 
caja fue lograr que el observador la empleara como trampolín, pero en ocasiones 
sin hacer esfuerzo alguno para acercarla al señuelo. Cuando el problema se domi- 
naba, el chimpancé solo en una jaula con la caja y el piátano se alejaba de la meta 
para buscar la caja y colocarla en la posición adecuada. Según Kóhier, esta carac- 
terística de '"desviación”” de la conducta de discernimiento es una de las más im- 
portantes. 

El problema de apilar cajas, que consiste en colocar dos de ellas, una sobre la 
otra, a fin de alcanzar el plátano, es mucho más difícil. Requiere de la inclusión de 
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la segunda caja en el patrón de solución, y un dominio del problema de construir 
una estructura estable con dos cajas. Aunque por lo común en las apreciaciones 
secundarias de los trabajus de Kúhler se destaca la inteligencia que mostraban los 
monos, él mismo se encuentra en apuros cuando debe explicar el grado de aparen- 
te estupidez de los animales, Por ejemplo, en el experimento de apilar cajas creía 
que los monos habían mostrado discernimiento en la relación de *“una caja encima 
de la otra”, pero no en la naturaleza de una estructura estable de dos cajas. Esa 
estabilidad física, tal como se adquirió en estructuras posteriores, fue en esencia 
una cuestión del método de ensayo y error. 

Los problemas con las varas requieren de! uso de una o más herramientas para 
obtener la comida que se encuentra fuera del alcance del animal, al otro lado de las 
rejas de la jaula. El inicio del discernimiento ocurre a medida que la vara entra en 
juego, en algunas ocasiones sin éxito, como cuando el morío la arroja hacia el pláta- 
vo y la pierde. Una vez que la ha usado con provecho, el simio la busca y la utiliza 
con celeridad, El experimento más ilustrativo fue un problema dominado por Sul 
tán, en el que finalmente insertó una vara en otra, como una caña de pescar aco- 
plada, a fin de alcanzar un plátano que no podía alcanzar con una sola yara. El pro- 
ceso fue lento, y la primera colocación de las dos varas juntas pareció ser más o 
menos accidental; sin embargo, una vez que Sultán observó ambas varas en esta 
relación, logró “captar la idea” y repetir varias veces la inserción de uma dentro 
de la otra, hasta alcanzar el plátano distante. 

La interpretación que Kóhler proponía de esa ejecución era que sus chimpancés 
estaban realizando intentos inteligentes en la resolución de problemas; que cuando 
el simio se enfrentaba con una dificultad podía repasar las condiciones relevantes, 
tal vez pensar en el probable éxito de un acto dado, y entonces comprobarlo como 
una posible solución al problema. Kóhler se interesaba principalmente por la ma- 
nera en que ses monos podían de repente “ver” el valor instrumental de una he- 
rramienta (la vara como una extensión del brazo), como medio para alcanzar el 
objetivo. Debido a estas interpretaciones perceptiales de las experiencias “*Eure- 
ka”, se les denominó experimentos de discernimiento mientras la repetición del 
acto exitoso a raíz del discernimiento se llamó aprendizaje por discernimiento. 

Aunque los ataques de Kúhler y de Kofíka estaban básicamente dirigidos a 
Thorndike, tuvieron lugar en una época en que la psicología estadounidense esta- 
ba apresada por un conductismo seguro pero algo estéril. Á esta distancia histó- 
rica €s difícil determinar por qué una noción tan familiar y con tanto sentido común 
como el discernimiento en el aprendizaje o resolución inteligente de problernas, 
fue capaz de crear tal conmoción. Pero en esa época, el conductismo watsoniano 
había ganado apoyo para un punto de vista bien elaborado del aprendizaje, según el 
cual el organismo era manejado por los empujones y tirones del ambiente, y reac- 
cionaba de formas esencialmente estúpidas. La doctrina conductista se inclinaba a 
no atribuir procesos mentales superiores a los animales o al ser humano, a no ser 
que se viera obligada a hacerlo como último recurso. Por lo tanto, el retorno a una 
opinión más equilibrada, representada por los experimentos de discernimiento, 
dio renovadas esperanzas a los maestros y a todos aquellos que veían que el pensa- 
miento y la comprensión recobraban su respetabilidad. El discernimiento no cons- 
tituía un descubrimiento, sino que significaba el regreso a una concepción que el 
lego nunca había abandonado. Nadie influido por doctrinas particulares podría ha- 
ber negado jamás la realidad del discernimiento, pero es citrioso que a Kóhler le 
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haya tocado restaurarlo como tal en la psicología estadounidense. En algunos as- 
pectos, era el momento propicio para un cambio, y los experimentos de Kóhler 
pusieron de relieve la liberación de las negaciones por parte del pensamiento de 
Thorndike y de Watson. 

No es sorprendente que la recepción más entusiasta a las nuevas teorías del 
aprendizaje haya provenido de los educadores.? Ya se había producido un distan- 
ciamiento entre Thorndike y el grupo más avanzado dentro de la educación, que 
bajo e) liderazgo de Dewey ahondaba mucho más que Thorndike en lo que toca a la 
capacidad del individuo para plantear y resulver sus propios problemas. El niño 
aprende al comprender la estructura de un problema, no mediante la repetición in- 
cansable de una fórmula incomprensible. La nueva doctrina del discernimiento se 
puso verdaderamente a la altura de su lema de liberación de la inteligencia para la 
actividad creativa, 

La visible oposición entre Kóhier y Thorndike se refería al discernimiento y al 
método de ensayo y error; es decir, al aprendizaje intetigente en contraste con la 
búsqueda a ciegas. Pero la oposición entre la psicología de la Gestalt y la psicología 
de la asociación es mucho más profunda. A fin de comprenderla, es necesario exa- 
minar a fondo las concepciones del primer enfoque. 

Hay un gran número de variantes entre el movimiento de la Gestalt y aquellos 
otros fuertemente influidos por las concepciones de la misma. Kúhler y Kofíka 
fueron los más próximos a Westheimer, el fundador oficial de la escuela, de 
manera que este capítulo está dedicado al análisis del tratamiento que ambos in- 
vestigadores dan aprendizaje. Lewin, aunque originario de Berlín y definitivamen- 
te dentro de la línea, comenzó nuevos trabajos. Estos cuatro hombres, de origen 
alemán, terminaron por establecerse en los Estados Unidos, donde murieron. To- 
dos ellos fueron líderes de lo que históricamente se conoce como la psiculogía de 
la Gestalt. 

El tratamiento más sistemático y completo de los problemas del aprendizaje des- 
de el punto de vista de la Gestalt se encuentra en la obra de Kofíka: Principles of 
gestalt psychology (1935). El texto se escribió después de un periodo de aclima- 
tación en Estados Unidos, y por eso se ajusta un poco mejor que las obras anterio- 
Tes a los intereses de los psicólogos estadounidenses. La mayor parte de las re- 
ferencias directas se refieren a esta fuente. 


PRIORIDAD DE LA PERCEPCIÓN EN LA TEORÍA 
DE LA GESTALT 


La psicología de la Gestalt se inició y obtuvo sus mayores éxitos en el campo 
de la percepción. Sus demostraciones del papel del fondo y la organización sobre 
los procesos percibidos fenomenológicamente son tan convincentes que sólo un 
opositor más que obstinado desvirtuaría sus logros. El ataque central a la teoria de 
la asociación se enfocó sobre la teoría del haz de sensación la cual sostiene que una 
percepción se compone de un haz de elementos de tipo sensorial, vinculados entre 
sí por la asociación. 


1El traductor de Kofíka (1923) fue un psicólogo educador, R. M. Ogden. 
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Cuando los psicólogos de la Gestalt se abocaron a los problemas del aprendizaje, 
el equipo utilizado para estudiarlo fue el que les había resultado útil en el campo de 
la percepción, y los argumentos que antes habían esgrimido en contra de la sensa- 
ción se volvieron en contra del reflejo. Los psicólugos gestaltistas se han intere- 
sado moderadamente por el aprendizaje, a pesar de la atención que merecieron los 
experimentos de Kóhler con simios. Esto no significa que sus pocos trabajos ca- 
rezcan de importancia, sino que se ha considerado que los problemas del aprendi- 
zaje son secundarios si se los compara con los de la percepción. Es posible que en 
Estados Unidos ocurra lo contrario, y al habernos preocupado por el aprendizaje 
hayamos descuidado la relación entre los dos campos. 

El punto de partida del tratamiento Gestalt del aprendizaje es la premisa de que 
las leyes de la organización en la percepción son aplicables al aprendizaje y a la me- 
moría, Lo que se almacena en la memoria son huellas de cuentos perceptuales, y 
como las leyes organizacionales rigen la estructura de las percepciones, también 
determinan la estructura de la información que se establece en la memoria. En el 
caso del aprendizaje por ensayo y error, en el cual el aprendiz se enfrenta a algún 
problema (por ejemplo, escapar de la caja problema), la teoría de la Gestalt asigna 
una gran importancia a la forma en que el sujeto estructura o “ve” la situación 
problemática, y aún sobresaliente en la acción correcta dentro de esa estructura. 
Así, la facilidad o dificultad del problema es en gran parte una cuestión de per- 
cepción. En este sentido, a los monos de Kóhler se les presentaban problemas 
perceptuales; si literalmente 'veían” la situación de modo correcto, tenían dis- 
cernimiento. 


Las leyes de la organización perceptual 


A continuación describiremos algunas de las leyes de la organización perceptual 
como fueron propuestas en su forma inicia) por Wertheimer en un artículo clásico 
(1923, traducido y publicado en inglés en 1938). El investigador describe ciertas 
variables de estísmulo que rigen el modo en que agrupamos determinados estí- 
mulos y, por lo tanto, la forma en que estructuramos o interpretamos de cierta 
manera un campo visual. Wertheimer menciona un cierto número de factores sub- 
sidiarios, pero aquí súlo veremos los factores de figura-fondo, proximidad, simni- 
litud, dirección común y simplicidad. Los gestaltistas se han esforzado por formu- 
lar una ley más general que estipule las características comunes de estas leyes 
subsidiarias del agrupamiento. Esta formulación se denominó ley de la Prágnanz 
(que no se traduce como **preñez* sino como **compacto y significante””), la cual 
establece que la organización psicológica (léanse *“agrupamientos perceptuales*”) 
tiende a las '“buenas gestalts*' o “buenas figuras”, como lo determinan las leyes 
subsidiarias, y que esta organización tiene las propiedades de regularidad, simpli- 
cidad, estabilidad en el transcurso del tiempo, etcétera. Aunque Kóhler y Koffka 
trataron de explicar la operación de esta ley de Pragnanz en términos de distribu- 
ciones dinámicas de campos de energía en el cerebro, las generaciones subsi- 
guientes consideraron que tales explicaciones son relativamente cortas (Madden, 
1962), y no se comentarán en este lugar. Sin embargo, intentaremos ilustrar 
cómo se ha usado o cómo puede aplicarse cada ley perceptual en un experimento 
de aprendizaje. 
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Figura 10.1. El cubo de Necker, una ilusión diseñada 
en 1832 por el naturalista suizo L. A, Necker. Obsér- 
vese que la superficie sombreada puede aparecer 
como la superficie frontal o posterior de un cubo 
transparente. 


1. Relaciones de figura-fondo 

La distinción más primitiva del sistema perceptual humano es la que se efectúa 
entre la figura y el fondo. Así, las palabras de esta página son figuras contra el fon- 
do del espacio en blanco que los rodea. La figura es aquello en lo que se enfoca la 
atención: resalta y es más notable y sobresaliente que el fondo. Generalmente, 
una figura visual se define por los contarnos o discontinuidades de una brillantez o 
color diferentes respecto al fondo. En algunos casos, lo que son la figura y el fondo 
en una escena dada resulta ambiguo, y el sujeto que percibe puede organizarlos de 
cierta manera, y entonces cambiar y verlos de otra. El cubo de Necker que se 
presenta en la figura 10.1, es un ejemplo familiar de una figura ambigua; en él la 
cara frontal se cunvierte en la del fondo cuando el sujeto que observa la reorganiza 
espontáneamente. Otra figura reversible es la que aparece en la figura 10,2, que 
puede verse como las siluetas de dos caras o como una copa de vino. 


Figura 10.2. Figura y fondo rever- 
sibles. ()dbsérvese que tanto la 
parte clara (la copa) como la os- 
cura llos dos perfiles) pueden 
percibirse como una figura con- 
tra un fondo. 
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Para los estudios del aprendizaje la importancia de la figura-fondo reside en que 
la gente aprende básicamente acerca de la figura en la que concentra la atención, y 
no acerca del fondo. Las instrucciones que se les dan a los sujetos humanos a me- 
nudo influyen en lo que se convierte en una figura importante. Si se les dice que 
aprendan pares de palabras presentadas en diferentes tarjetas de colores, los su- 
jetos por lo general aprenden relativamente poco acerca del color, ya que no le 
han prestado atención y no se lo han repetido como “perteneciente” al par de pa- 
labras en cada tarjeta. De modo similar, si un sujeto organiza un cuadro ambiguo 
—por ejemplo, el de Ja figura 10.2— como una copa de vino, no lo reconocerá sien 
un ensayo de prueba posterior lo organiza como siluetas de caras. En otras pala- 
bras: su recuerdo de esa experiencia inicial no es la del cuadro “*en bruto y no ana- 
lizado””, sino el de una interpretación figurativa de una copa de vino. Este fracaso 
de la memoria de reconocimiento con interpretación perceptual alterada de un es- 
tímulo se demostró en los cuadros de Rubin (1921), y de Wiseman y Neisser 
(1971), y para sonidos naturalistas ambiguos por G. H. Bower y Holyoak (1973). 
Lo importante es que los objetos interpretados perceplualmente —y no los estímulos 
en bruto— son los que se aprenden, y por eso es crítica la similitud de los proce- 
sos perceptuales a lo largo del aprendizaje y durante la retención. 


2.La ley de la proximidad 

Los elementos de un campo tienden a agruparse de acuerdo con su cercanía o 
proximidad. Cuanto más cerca se encuentren dos elementos, mayores probabi- 
lidades tienen de agruparse. En la figura 10.3 se muestran varias ilustraciones 
realizadas con puntos. En (a), los grupos se perciben en conjuntos de tres, como 
abc/def/ghi, en vez de otro agrupamiento como ab/cde/fgh. En (b), agrupamos los 
elementos como tres hileras de tres puntos en vez de tres columnas de puntos. 
En (c), agregamos los puntos en grupos a/bed/cfahi4kimnop con base en sus pro- 
ximidades relativas. 

Esto ilustra el factor de la cercanía con estímulos visuales distribuidas en el es- 
pacio. Pero también podemos definir la proximidad con estímulos auditivos discre- 
tos distribuidos en el tiempo. Al tocar un tambor, se notarán grupos auditivos que 
emergen como resultado de la alternancia de intervalos temporales breves y lar- 
gos (“'proximidades'”) entre los golpes. Estos conjuntos elaborados en jerarquías 
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Figura 10.3. Ilustraciones de la proximidad . . 


coma factor de agrupamiento. . 
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complejas de agrupamientos dentro de agrupamientos constituyen la base del rit- 
mo musical. 

Las ilustraciones con puntos y golpes en el tambor demuestran la ley con estí- 
mulos relativamente neutrales o carentes de significado. Pero este factor de la pro- 
ximidad está en uso constante cuando nos comunicamos mediante la lectura, la 
escritura o el habla. Escuchamos ('“organizamos'') el lenguaje como una serie de 
palabras distintivas con pausas entre palabras y oraciones, aun cuando un especto- 
grama muestre una corriente casi continua de sonido (que es la forma en que 
oímos un idioma extranjero desconocido). En la lectura se usan espacios entre las 
palabras a 6n de se-gre-gar-las-pa-la-bras-en-u-ni-da-des, y la misma se complica 
cuando se rompe esta segregación. Las hileras de palabras o siglas familiares tal 
vez ni siquiera se reconozcan sj se le presentan al sujeto con rapidez, agrupadas 
en unidades nuevas. En las investigaciones acerca de la memoria dirigidas por G. 
H. Bower y Winzenz (1969), y por Bower y Springston (1970) hay ejemplos del 
uso de este factor de agrupamiento. Estos últimos experimentadores hicieron que 
sus sujetos (estudiantes universitarios) recordaran inmediatamente un número de 
serie de 12 letras que se les leían de acuerdo con una estructura particular de pau- 
sas. Con guiones que indican pausas temporales, una serie típica para recuerdo po- 
dría ser 1C-BMF-BIJ-FKCO. Un aspecto importante es que los grupos definidos 
por la pausa tienden a comportarse en el recuerdo como unidades de todo o nada; 
es decir, la persona tiende a recordar todo el bloque o nada de él, Esto significa, 
por ejemplo, que la J en el tercer bloque está mucho más vinculada (o asociada) a 
la B y ala /, que a la F que la sigue en orden. Buwer y Springston (1970) demos- 
traron también que el recuerdo de una serie de letras era mucho mejor si las pau- 
sas se segregaban en siglas familiares. Así, la serie anterior $e recordaba mejor si 
se presentaba según la estructura de pausas ICBM-FBF-JFK-CO, en la cual los 
grupos definidos por la pausa (''perceptual””) corresponden a siglas familiares que 
la persona ya conoce. 

Ya hemos encontrado antes a esta ley del agrupamiento disfrazada bajo el princi- 
pio de la pertenencia, de Thorndike. Dos eventos se asociarían sólo si se cortes- 
ponden, y uno de los determinantes de esta pertenencia de A con B es que los 
dos ocurren próximos en el tiempo o en el espacio. 

Por ejemplo, supóngase que a un estudiante se le dice que aprenda el siguiente 
material: 


CUF-NUX 
PEL-JER 
DEQ-PEM 
SOQ-RIL 


En pruebas posteriores se descubrirá que el estudiante trató al material como 
constituido por pares, repriendo y asociando CUP con NUX, y PEL con JER, etcé- 
tera, Sin embargo, no ha formado asociaciones desde NUX hasta PEL, o desde NUX 
hasta JER, a pesar de que todos estos elementos están espacialmente próximos. 
No se ve que los pares posteriores correspondan. Esto ilustra el hecho de que el 
procedimiento de aprendizaje de pares asociados se aprovecha más de la ley de la 
proximidad para definir los grupos que se aprenderán, y para hacerlos resaltar 
unos de otros. 
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3 La ley de la similitud 

La ley de la similitud estipula que los reactivos similares en lo que respecta a al- 
guna característica (forma, color, textura, etc.) tenderán a agruparse, sienpre 
que factores de proximidad no anulen este efecto. En la figura 10.4 se proporcio- 
nan varias ilustraciones de este factor. El cuadro (a) se organiza en ternas sucesi- 
vas de puntos blancos y negros, mientras el (b) se percibe como columnas suce- 
sivas de puntos blancos y negros alternados, Estos, factores de similitud pueden 
ponerse en oposición o en complementación para los agrupamientos sugeridos por 
las proximidades de los elementos. El cuadro (c) muestra la oposición de los dos 
factores, en la cual gana claramente la proximidad espacial; éstos se ven como pa- 
res segregados espacialmente con puntos blancos y negros, que se alternan en or- 
den izquierda-derecha. El cuadro (d) muestra la '“adición”* de los dos factores, 
que sugieren los mismos agrupamientos. 

Un factor similar opera en la percepción de grupos auditivos; por ejemplo, de 
sonidos que difieren en timbre. Así, dos sonidos (C y F) que se tocan en pares se 
oyen como CC/FF/CC/FF, en vez de oírse C/CH/FC. Tal factor también con- 
tribuye a la percepción del ritmo musical, 

Cuando leemos o hablamos, utilizamos constantemente al citado factor. Por 
ejemplo, en una fiesta podemos escoger, escuchar a una persona que habla contra 
un fondo midoso, debido a la similitud de la calidad de la voz del que habla, de un 
momento al siguiente. Nuestro seguimiento de un mensaje verbal se torna cada vez 
más difícil si la calidad de la voz se altera constantemente (al empalmar en una cin- 
la magnetofónica una voz diferente para cada palabra del mensaje). Se obtiene un 
resultado similar al leer ToDaSlAsLeTrAsJuNtAs (todas las letras juntas), donde 
todas las letras dentro de una palabra suelen tener casi el mismo tamaño y color, 
lo que facilita el agrupamiento. 

En un experimento de aprendizaje dirigido por CG. H. Bower (1972a) se ilustra la 
potencia de este factor de similitud para promover bloques de grupos de letras 
en el recuerdo. A estudiantes universitarios se les mostraban tarjetas relámpago en 
cada una de las cuales estaban impresas doce letras con el mismo espaciamiento, 
que comprendían cuatro siglas familiares, Las letras variaban en tamaño; en algu- 
nas tarjetas los agrupamientos pequeños y grandes correspondían a la serie de si- 
glas; en otras, no correspondían. Un ejemplo de una serie correspondiente es 
YMCAusalBMai, mientras que una serie no correspondiente de las mismas letras 
sería YMcauSAlbmgi. Cada serie se mostraba durante unos cuantos segundos an- 
tes de que al sujeto se le pidiera que la recordara. Como cabía esperar, cuando las 
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sucesivas letras de una sigla se presentaban en el mismo tamaño, tendían a verse 
como un grupo y a reconocerse y recordarse como el grupo familiar que eran. Sin 
embargo, en los casos no correspondientes, los sujetos se inclinaban a adoptar los 
agrupamientos (por similitud de tamaño) en bloques no familiares, y por eso su re- 
cuerdo era más pobre. Así, por ejemplo, en la ilustración anterior la persona pro- 
pende a recordar las letras SAJ como una unidad de todo o nada (aunque ma?), en 
vez de superar los agrupaniientos perceptuales para recordar USA/IBM como 
unidades, Tan sólo al variar los colores de las letras sucesivas de la tarjeta, se pro- 
dujo un efecto similar sobre el recuerdo, Las primeras cuatro tarjetas podían ser 
rojas, las siguientes tres amarillas, las tres siguientes cafés, y las dos últimas azu- 
les. Si las siglas de diferentes longitudes también se dispusieran en este orden, 
primero la sigla de longitud 4, después dos de longitud 3, y por último la sigla de 
longitud 2, entonces las letras de una sigla dada serían del mismo color, lo cual 
ayuda a su uso y fomenta su recuerdo, Pero si el orden de las longitudes de siglas 
entra en conflicto con los colores, el reconocimiento de las abreviaturas familiares 
es peor, y el recuerdo de las series mostradas brevemente, peor todavía, 


4, Lo ley de la dirección común 

Un conjunto de puntos tiende a agruparse si algunos parecen continuar o com- 
pletar una serie válida o extrapolar una curva simple. Este principio se ilustra me- 
jor con algunos ejemplos corno los que se presentan en la figura 10,5. Conside- 
remos el cuadro (a): mediante una medición de la proximidad física, los puntos que 
comprenden las líneas A y B están más cercanos que los de las líneas A y C; sin 
embargo, nuestro ojo tiende a asignar Á y C al mismo grupo es decir, como partes 
de la línea simple AC, de manera que B sería sólo un apéndice que parte de esta lí- 
nea. No obstante, al acercar la línea A a la C, como en la figura derecha del cuadro 
(a), la organización se altera de tal modo que A y B van juntas para integrar una 
unidad de línea, mientras que C se convierte en el apéndice. En este último caso, 
Bes una extrapolación de la curva (línea, regla) iniciada en la parte A. 

El cuadro (b) es tan sólo un conjunto de puntos dispuestos en una línea sesgada 
por “'interpretación direccional”” de los puntos. Pero las visiones alternativas son 
lógicamente posibles; por ejemplo, la segunda hilera de puntos podría haberse or- 
ganizado como tres conjuntos de pares de puntos en una hilera, Pero no están así: 
l dirección común y simple de los puntos dicta la organización sesgada. 

En los cuadros (c) y (d), el principio de la buena continuación se ilustra de un 
modo un tanto distinto. El cuadro (c) se ve (organizado por nuestro sistema per- 
ceptual) como una curva ondulada (AD) cortada por una línea (BC); pero lógica- 
mente podríamos haberla vista como la onda-más-la-línea AC vinculada a la línea- 
más-onda BD. De la misma forma, el cuadro (4) está organizado como una serie 
de dientes cuadrados intersectados por una línea ondulada continua, mientras que 
lógicamente se le podría haber visto como una mitad superior C, D, G, H, K, L, 
trazada encima de la mitad inferior A, B, E, F, 1, 7, M. El factor de la dirección 
común o “destino común'” determina las descripciones naturales anteriores de 
estos trazos. 

El cuadro (e) ilustra un punto similar al del cuadro (4); es decir, que nuestro ojo 
parea el segmento de línea A con C porque uno es continuación o extrapolación re- 
gular y uniforme del otro, mientras que el segmento B o Bl altera la dirección de la 
curva, colocando una '“enroscadura”” a discontinuidad en la curva. 
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Es relativamente fácil demostrar los efectos del aprendizaje debidos al factor de 
L buena continuación. Kaswan (1957) realizó una demostración elemental cuando 
sometió a prueba la facilidad con la que sus sujetos asociaban pares de figuras geo- 
métricas, A con 33, donde el segmento B era o no una huena continuación del seg- 
mento A, Después de ver muchos diferentes pares A-B, se sometfa a) sujeto a 
prueba mediante la presentación de la parte A de cada par, y se le pedía que recor- 
dara (con un dibujo) la parte B. Al mirar, por ejemplo, el cuadro (£) de la figura 
10.5, al sujeto se le mostraría el segmento A y tendría que recordar la parte que 
estaba pareada con él, ya se tratara de D (si ésta había ejemplificado buena 
continuación) o de C (en caso contrario). Como era de esperar, Kaswan encontró 
que los pares que ejemplifican el principio de la buena continuación se aprendían y 
serecordaban mucho mejor que los que no lo ejemplificaban. 

Esta demostración plantea incidentalmente el problema de si las respuestas, en 
los casos de continuación y no continuación, transportan la misma cantidad de in- 
formación, dando el estimulo como un indicio de recuerdo. Si se tiene en cuenta la 
extrapolación del indicio, no hay más que unas cuantas buenas continuaciones, qui- 
24 sólo una, como respuesta a un segmento de indicio, pero hay literalmente una 
infinita variedad de no continuaciones posibles. Es probable que la característica 
más unportante sea que, para los pares de buena continuación, el estímulo res- 
tringe las posibles respuestas a una o a un pequeño número de ellas. 
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El principio de la buena continuación puede mostrarse con materiales alfabéticos 
o numéricos, donde haya alguna posibilidad de inducir una regla para la extrapola- 
ción de una serie de reactivos. Este tipo de extrapolación interviene en los problemas 
de terminación de letra como los que suelen encontrarse en las pruebas de in- 
teligencia. Se dan unas cuantas letras en una serie, generadas por alguna regla pe- 
riódica al pasar por ciclos del alíabeto (hacia adelante o hacia atrás) y la persona ha 
de inferir cuál es la regla y aplicarla para generar el elemento siguiente. Así, la 
serie abcbededede tiene un periodo de tres, y forma ciclos por el alfabeto hacia ade- 
lante; por lo tanto, la serie se completa con la letra f. Con las series matemáticas 
ocurren problemas similares de inducir una regla de generación; así, la serie 1, 3, 
7, 13, 21 se reconoce como la serie n? + 1 + 1, y tiene a 31 como el sucesor si- 
guiente. 

Los experimentos de Restle y Brown (1970) también ilustran la buena conti- 
nuación en el contexto del aprendizaje. Se trata de experimentos acerca del apren- 
dizaje de patrones sertales, en los cuales los sujetos aprenden a predecir secuencias 
periódicas recurrentes de dígitos, como 3454543. Se demuestra que los suje- 
tos descomponen conceptualmente las secuencias en “cadenas” (como 345) y 
“trenes”” (como 454), y aprenden el patrón como una jerarquía organizada de 
esas partes o subsecuencias. Una serie de números, como en la escala musical, se 
define por la continuación de una serie de elementos en una dirección dada. 


5. La ley de la simplicidad 

Esta ley establece que si todo permanece constante, la persona ve el campo 
perceptual como si estuviera organizado en figuras simples y regulares. Es decir, 
habrá una tendencia hacia las buenas Gestalt de simetría, regularidad y uniformi- 
dad. De nueva cuenta, esta noción es más fácil de ilustrar que de describir con 
palabras; en la figura 10.6 se muestran algunos casos. Por ejemplo, nuestro ojo tien- 
de a dividir la figura del cuadro (a) en una elipse (AC) que se superpone a un cua- 
drado (8D), aunque otra descomposición lógicamente posible es AB (una elipse 
con un bloque faltante) que linda con DBC (un cuadrado con un arco interior), De 
modo similar, en el cuadro (b) la figura de la izquierda semeja dos carámbanos su- 
perpuestos, mientras que la figura de la derecha parece un rombo inscrito dentro 
de un carámbano largo; pero la segunda puede descomponerse lógica, pero no psi- 
cológicamente, en los mismos dos carámbanos superpuestos orientados de modo 
diferente, En el cuadro (c), las presiones hacia la simplicidad nos persuaden a es- 
tructurar el diseño como “*un círculo enfrente de un triángulo”, e inferir el trián- 
gulo oculto en vez de describir a la figura como *'tres pequeñas puntas a las horas 
de 4, 8, y 12 de un círculo””. 

En estos casos, y en cientos del mismo tipo, la simplicidad áigurativa es un prin- 
cipio dominante que dicta la manera en que la figura se “analiza gramaticalmen- 
te'' o se descompone en sus elementos constituyentes. Las figuras siempre son 
ambiguas en el sentido de que tienen múltiples descomposiciones lógicas; también 
son ambiguas en cuanto a que los arreglos bidimensionales pueden ser la proyec- 
ción de una gran variedad de objetos tridimensionales y sus relaciones. Pero el 
principio Gestalt de la simplicidad (o buena Gestalt) ayuda mucho a prescribir qué 
descomposición o interpretación de la figura ambigua dominará, 

Otra demostración de la ley de la simplicidad se presenta en el experimento del 
punto ciego que se ilustra en el cuadro (d) de la figura 10.6. Todas las personas 
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Figura 10.6. Algunas ilustracio- o) d) 


nes de la senciilez figurativa 
como factor en la organización 
perceptua! 


tienen un punto ciego en cada ojo; es aquel punto de la retina del cual emana el 
tracto óptico. Un estímulo de punto proyectado exactamente en ese lugar no se 
ve; es un punto ciego. Con este marco de referencia puede explicarse la observa- 
ción central, Supongamos que hemos descubierto que cuando una persona fija la 
vista en un punto dado a un lado de la figura en el cuadro (d), su punto ciego se lo- 
caliza en el espacio precisamente en la intersección de las cuatro líneas de la figura. 
Si la figura del cuadro (d) se presenta ahora a la persona de tal modo que el centro 
de la misma se localice en el punto ciego del sujeto, éste “Henará el hueco”” y verá 
las líneas en visión periférica como una cruz completa. Otras figuras Con vacios 
producen percepciones similares de figuras cerradas y completas. La persona lle- 
na el hueco con la extrapolación redundante y predecibie de la descripción más 
simple de la figura. A esto se le conoce como fenómeno del cierre. El principio es 
que las áreas cerradas o las figuras completas son más estables que las áreas no 
cerradas o las figuras incompletas. 

Estos principios de la organización perceptual pueden aprovecharse en el arte 
del camuflaje (Wertheimer, 1923), donde una figura significante particular se ocul- 
ta al extender y complementar sus líneas, de modo que la atención se distrae com- 
pletamente de la forma original, De esta manera se Hace muy improbable el análi- 
sis gramatical particular del patrón. Un ejemplo simple de esa transformación de la 
letra F se muestra en los cuadros (2), (b) y (c) de la figura 10.7. La F está total- 
mente oculta o “incrustada” en la figura de reloj de arena (c), a la derecha, Por 
otra parte, si las Ííneas se suman pero no tocan los extremos ni continúan las líneas 
dela F, como en el cuadro (d), la F permanece como una unidad distintiva. 


La naturaleza holista de la percepción 


Los psicólogos de la Gestalt recalcan que la percepción de la forma emerge de 
las relaciones entre sus partes, y en tal proceso las partes podrían perder sus pro- 
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c) 


at b) 


a) 


Figura 10.7. Ejemplo de las etapas sucesivas en el camuflaje de una forma, la letra F. 


piedades anteriores y adoptar nuevas, determinadas por la forma del patrón cor 
pleto. El camuflaje de la F en la figura 10.7c es un ejemplo sencillo; las líneas de la 
F simplemente se asimilan dentro de otra forma y aparecen como bandas de la fi- 
gura del reloj de arena. Otro ejemplo es el de los tonos que integran una melodía 
musical. Tocados aisladamente, cada uno de ellos tiene una cierta altura y volu- 
men subjetivos, pero en el contexto de una melodía estos elementos dependen de 
la relación con sus vecinos. La misma nota sonará muy distinta cuando se toque en 
dos melodías diferentes. De modo similar, una determinada melodía es una forma 
auditiva definida por las relaciones (razones) entre tonos sucesivos, no por los to- 
nos absolutos, ya que la misma melodía puede transportarse a otra clave, y tocar- 
se casi en cualquier clave u octava musical y con cualquier instrumento. Se dice 
que las formas perceptuales *“emergen”* de arreglos particulares de elementos, y 
que tienen propiedades no predecibles sólo a partir de las propiedades de los ele- 
mentos. Un ejemplo de una propiedad física emergente sería la naturaleza líquida 
del agua compuesta de gases de hidrógeno y oxígeno; una propiedad psicológica 
emergente es el movimiento aparente (o el fenómeno phi) creado al mostrar rápi- 
damente una serie discreta de fotos fijas superpuestas (de movimientos conti- 
nUOS) como se hace en el cine. 

Tales ejemplos ilustran la idea de que los atributos de las partes, en tanto pue- 
den ser definidos, dependen de sus relaciones con el sistema, considerado como 
un todo, en el cual funcionan. Esta visión holista de la percepción ha sido en gran 
parte aceptada por las modernas teorías perceptuales, donde se le conoce como 
procesamiento determinado por el contexto o superiorinferior. La cuestión es 
que los aspectos del patrón completo pueden conjeturarse antes de que sean 
identificadas partes específicas. En h figura 10.8 se muestra un ejemplo. Las 
características faciales (nariz, orejas, labios) reconocibles en el contexto del ros- 
tro no se identificarían como tales fuera de dicho contexto. Las modernas teorías 
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identificabilidad de dibujos )i- 


neales como características fa- Bostro 
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1975). 


de la percepción de la forma usan la información del patrón completo para constre- 
ñir h interpretación de las partes. 

A fin de lograr que la discusión sea relevante para el aprendizaje, la determi- 
nación de las propiedades de las partes mediante las características holistas se 
arregla con facilidad en los experimentos acerca de la memoria humana. Se sabe 
que la dificultad de recordar una lista de palabras para el recuerdo libre depende de 
las relaciones entre las palabras. De este modo, si una regla simple describe un 
conjunto de palabras, el recuerdo de ese conjunta se incrementa considerable- 
mente. Un ejemplo de tal regla sería que todas las palabras en la lista rimaran con 
frog (rana). Esa es una regía de recuperación que el aprendiz conocedor puede uti- 
lizar para generar en el momento del recuerdo los puntos de la lista o los reactivos 
que han de aprenderse. Así, un reactivo como si0g (humo con niebla) se ha hecho 
fácil de recordar (comparado con su dificultad en una lista aleatoria) debido a una 
propiedad holista de la lista; es decir, su presencia en una lista de palabras que ri- 
man con frog. Para ejemplos más sutiles de propiedades holistas que facilitan el 
aprendizaje de recuerdo, véanse los artículos de G. A. Miller (1958), y Whitman y 
Garner (1962). 


LOS PROBLEMAS ESPECIALES DEL 
APRENDIZAJE 


El punto de vista general de la psicología de la Gestalt se expresa en la declara- 
ción de que las leyes de la organización se aplican por igual a la percepción y al 
aprendizaje, Sin embargo, hay problemas especiales dentro del aprendizaje acerca 
de los cuales los gestaltistas elaboraron especialmente sus ideas. Se sentían más 
cómodos al abordar el tema de la memoria humana que al discutir los experimen- 
tos de condicionamiento animal, y por ella la mayor parte de los ejemplos siguien- 
tes tratan de la memoria humana. Una primera complicación consiste en cómo 
representar Una memoria; €s decir, cómo conceptualizar la manera en que las expe- 
rencias pasadas persisten en el presente. Ésta es la preocupación de la teoría de 
lí huella, que veremos a continuación. 


La teoría de la huella 


La concepción Gestalt de un recuerdo no es muy diferente de la de Aristóteles, 
según la cual la percepción se graba en una huella correspondiente en la memoria. 
Los gestaltistas sostienen que los procesos neurales activos durante la percepción 
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pueden perdurar de forma amortiguada como una huella. Así, la información se al- 
macena sustancialmente de la misma manera, mediante los mismos procesos neu- 
rales que en la percepción original, Kóhler lo describe en los siguientes términos: 


Los eventos neurales tienden a modificar ligeramente el estado del tejido en el que acu- 
rren. Tales cambios se asemejan a los procesos por medio de los cuales se han producido, 
tanto en su patrón como en lo que respecta a otras propiedades (1938, pág. 236). 


El recuerdo implica la reactivación de una huella dada de la memoria; de hecho, 
es una restauración de los mismos procesos perceptuales que correspondían a la 
percepción original. La huella sigue existiendo en el sisterna nervioso como un 
proceso activo pero posee una intensidad demasiado baja como para entrar en la 
conciencia. En el recuerdo un indicio selecciona y amplifica la intensidad de una 
huella particular para elevarla sobre el umbral de la conciencia. 

Los gestaltistas consideran al fenómeno emplrico de la asociación, o coherencia 
de los elementos A y B en la memoria, como un producto secundario de que A y B 
se fusionen en una sola unidad, una percepción unitaria. Los elementos A y B no 
permanecen como hechos independientes, separados y neutrales conectados por 
un eslabón indiferente, como un tramo de cuerda entre dos objetos distintos. Más 
bien, A y B se organizan o se fusionan en un solo objeto, una unidad, un bloque. 
Las leyes de la organización ayudan a prescribir cómo se configurarán estas unida- 
des y con cuánta facilidad se les puede formar. Las antiguas leyes de la asociación 
delineadas por los filósofos (contigiidad, similitud, contraste, causa y efecto, etc.) 
se consideraban como correspondientes a las leyes Gestalt que rigen la formación 
de unidades organizadas; es decir, proximidad, similitud, buena continuación, y 
cierre. 

Solomon Asch (1969; Asch e al,, 1960) ha desarrollado varias demostraciones 
convincentes en torno al papel que desempeñan las relaciones perceptuales para 
fomentar la coherencia de dos reactivos en la memoria. Ha recabado evidencia 
acerca de las relaciones de figura-fondo, constitutivas visuales de la parte y el 
todo. En el experimento de figura-fondo, se expone a la persona a un conjunto de 
diez formas sin sentido pareadas con diez colores. Hay varias condiciones corres- 
pondientes a diferentes relaciones entre el calor y la forma con la que aquél se pa- 
rea, En el cuadro superior de la figura 10.9 se ilustran cuatro de esas condiciones. 
El marco representa la tarjeta relámpago en la cual se muestra la forma. En el 
caso (4), el color (C) se percibe como perteneciente a la superficie de la figura 
contra un fondo blanco (W), mientras que el cuadro (b) muestra la figura como 
blanca contra un fondo de color. En el caso (e), el color se ve como perteneciente 
al contorno delineado de la forma sin sentido, mientras que en (2) la tarjeta completa 
está coloreada y la forma se delinea en negro (8). Después de la exposición a esas 
diez figuras, se somete a cada sujeto a una prueba de memoria; un duplicado de 
cada contorno, trazado en negro sobre un fondo blanco, debe igualarse con uno 
de los diez fragmentos cuyos colores son idénticos a los usados en la serie de expo- 
siciones. Veamos los resultados. Cuando el color se presenta como perteneciente 
a la figura (ya sea su superficie o su color de contorno como en los cuadros (a) y 
(c), la igualación en la prireba de memoria es casi dos veces mejor que si el color 
pertenece al fondo y no a la figura, coma en los cuadros (b) y (d). De este modo, 
Asch estableció que la coherencia de un atributo y un objeto en la memoria era 
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Figura 10.9. Ejemplos de rela- 
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controlada por su coherencia en la percepción. Estos resultados se repitieron y 
ampliaron en un experimento de Arnold y Bower (1972). 

Dtra relación, que se ilustra en los cuadros medios de la figura 10.9, es la rela- 
ción constitutiva, en la cual una forma dada está compuesta a constituida por otro 
conjunto de formas más pequeñas. Por ejemplo, en la figura 10.9 se muestra un 
tipo de ocho figuras constituidas por puntos negros, y un rombo constituido por 
signos positivos. Los signos ““más”” y los puntos son los modos en que se expre- 
sanlas formas más grandes. Como en el experimento anterior, un sujeto sería ex- 
puesto a un conjunto de formas sin sentido expresadas con modos particulares, y 
más tarde se le sometería a una prueba de memoría para evaluar la coherencia en 
la memoria de la forma con su modo. La condición de control implicaba la presen- 
tación no unitaria de las mismas dos formas: la forma (por ejempla, el rombo) se 
presentaría a la izquierda, en su contorno, con una línea de signos “más”? (el 
modo) a la derecha de la tarjeta de estudio. Los dos grupos se comparan en una 
prueba de igualación en la que cada forma delineada y más grande debe igualarse 
con su forma pareada más pequeña (el modo). De nueva cuenta, los sujetos 
opuestos a las figuras unitarias, en las que las dos formas estaban relacionadas 
como *“forma X compuesta del modo Y”*, mostraron casi el doble de coherencia 
enla memoria de los pares de formas que los sujetos de control, expuestos a los 
pares no unitarios. 
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Se producía un efecto similar mediante la relación de la parte con el todo, de la 
cual hay dos ilustraciones en la parte inferior de la figura 10.9. Como se observa, 
un cuadro unitario se dividiría en dos subpartes, separadas horizontalmente para 
integrar los pares de control no unitarios. Los sujetos que habían estudiado los 
cuadros unitarios casi siempre recordaban con exactitud las subpartes juntas, 
mientras que los sujetos de contro) eran propensos a recordar sólo una subparte o a 
parear mal las subpartes cuando recordaban varias. Entonces, la unidad percep- 
tual de las subpartes nuevamente contribuye a la unidad de esas subpartes en la 
memoria. 

El punto importante a destacar es que la ley simple de la asociación por contigúi- 
dad resulta inadecuada para manejar estas ilustraciones. Ásch y sus predecesores 
han recalcado la relación entre dos elementos o características como un medio de 
aglutinarlas en una unidad o bloque. La contigúidad espacial o temporal (A antes que 
B, o A detrás de B) no basta por sí sola para representar una relación particular- 
mente convincente o sobresaliente; más hien es una condición necesaria para que 
se manifiesten otras relaciones más útiles. Este énfasis es contrario al elementa- 
lismo de algunas formas de asociacionismo, que consideraban a las relaciones no 
como hechos principales sino como hechos que podían descomponerse en otros 
no relacionales, que ocurren en contigúidad. 

Los anteriores ejemplos usan estímulos visuales geométricos para ilustrar los 
efectos de la unificación en la memoria. Sin embargo, pueden demostrarse tipos 
similares de efectos con materiales verbales o lingúísticos, Por ejemplo (Asch, 
1969), dos sílabas sin sentido se asocian con más rapidez si se pronuncian juntas, 
combinadas y fundidas como una palabra de dos silabas YAT.PIR o FUBNOL), en 
vez de tratarse y pronunciarse separadamente en pares cíclicos YAT-PIR). Como 
un segundo ejemplo, una lista de clichés de tres palabras (feliz año nuevo, huevos 
con jamón, estirar la pata) se recordarán mejor (y coherentemente) si se les 
muestra como el conjunto de clichés familiares que son, que si todas las palabras 
se mezclan y se presentan en grupos desconocidos de tres. El cliché es un bloque 
unitario para propósitos de memoria; se recuerda de una manera de todo o nada. 
Como un ejemplo final de la unificación, muchos dispositivos mnémicos para mejo- 
rar la propia memoria requieren que el aprendiz asocie dos reactivos al imaginarlos 
en algún tipo de relación única, generalmente una interacción vívida. Por ejemplo, 
para recordar una lista de actividades en las cuales voy a comprar leche después 
de adquirir un par de zapatos, puedo asociar zapatos con leche al imaginar mis za- 
patos llenos de leche y al verme a mí mismo bebiendo de ellos. Estas extrañas ela- 
boraciones mejoran notoriamente nuestra memoria (Bower, 19704; Paivio, 1971), 
Los gestaltistas afirmarían que la mejoran porque sirven para relacionar y 
organizar los dos reactivos (zapatos y leche) en una sola unidad conceptual o ima- 
ginativa, y la asociación es un producto secundario de la relación. Sin algunas de 
esas hipótesis, es difícil entender por qué el hecho de agregar material comple- 
mentario a un complejo de elementos que han de asociarse habrá de facilitar la for- 
mación de asociaciones entre los elementos críticos, más que competir con ella, 


Olvido 


Después de la exposición a los materiales de aprendizaje y con posterioridad a 
que la percepción haya establecido una huella unitaria en la memoria, ¿cómo se 
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produce el olvido? Los psicólogos de la Gestalt señalan dos aspectos o causas se- 
paradas del olvido, una de las cuales se refiere a las dificultades de la recuperación 
de la huella en el momento de la prueba, mientras la otra indica el decaimiento y 
desintegración de la huella en virtud de su contacto con huellas de interferencia. A 
continuación examinaremos cada uno de estos problemas. 


El olvido como fracaso de la recuperación 

Hóffding (1891) fue quien señaló un problema particular que las teorías de la aso- 
ciación habían pasado por alto: la manera en que la percepción de un estímulo 
actual puede recuperar selectivamente experiencias pasadas de significación espe- 
ciica para ese estímulo. Entre la gran cantidad de recuerdos que llevamos con no- 
sotros, ¿cómo hace contacto la situación presente con ese recuerdo específico 
apropiado para la ocasión? Supóngase que los abjetos de estímulo A y B se asocian, 
lo cual quiere decir que algunos procesos neuronales a y b se han fusionado (en la 
teoría de la Gestalt) en una unidad interdependiente ab. Debido a los cambios en el 
ambiente psicológico dominante, la segunda presentación del estímulo A es un 
evento diferente del anterior, que da lugar a un proceso perceptual un tanto dis- 
tinto, 4', La cuestión es cómo se las arregla «' para recuperar selectivamente la 
huella ad entre miles de opciones; este hipotético vacío entre la presentación de A 
y la recuperación de la huella 4b se denomina paso de Hofíding, ya que este inves- 
tigador fue el primero en estudiar el problema. 

Es importante reconocer que se trata de un problema para los asociacionistas 
clásicos. Éstos prestaban una atención explícita a la asociación, pero relativamen- 
te poca al reconocimiento de estímulo, Hóffding señalaba que el reconocimiento de 
estímulo, recuperar a de a*, parecería ser psicológicamente anterior a la activación 
de una asociación de a con ). La evocación asociativa segurameríte fallará a no ser 
que el indicio se reconozca como algo acerca de lo cual se ha aprendido alguna cosa. 

Hoófíding sugirió que e' hacía contacto con a en la huella de memoria ab con base 
en la similitud; como a' era más similar a a que a las huellas de otros estímulos, la 
huella ab se recuperaría en lugar de alguna otra. Los psicólogos de la Gestalt re- 
cogieron esta idea y argumentaron además que (por ejemplo, Koffka, 1935) su 
versión de la ley de la similitud era lo que explicaba la manera en que a y a' se 
agrupaban en el momento de la recuperación, 

Un problema básico con este enfoque de la similitud de la recuperación es que 
resulta esencialmente vago y nada revelador. Los estímulos y las situaciones tie- 
nen múltiples descripciones, de modo que entre cualquier tríada de situaciones A, 
B, C puede haber una infinidad de similitudes y diferencias; en algunas dimensio- 
nes de la descripción, A está más cerca de B; en otras, A está más próxima a C. 
El problema se convierte entonces en el de sopesar los diversos componentes de 
h similitud a fin de lograr predicciones que no sean ambiguas. Sin la evaluación in- 
dependiente de las “distancias psicológicas”, las explicaciones de los fenómenos 
en términos de la similitud del indicio y de la huella tienden a ser post hoc en vez de 
predicciones. 

Algunas ilustraciones de los indicios de recuperación de efectividad diferencial 
se muestran en la figura 10.10, en cuatro ejemplos distintos de entradas a ser 
aprendidas. Para cada patrón de entrada se presentan dos indicios diferentes. En 
cada caso, el miembro superior de ambos es el indicio de recuperación más efecti- 
vo para el recuerdo (recuperación) del patrón de entrada original. Los primeros 
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dos cuadros, con patrones geométricos (a) y (b), muestran que el mejor indicio de 
recuperación no es necesariamente aquel que físicamente se superpone más con 
el patrón de entrada; por ejemplo, el indicio (c) se superpone más con la entrada 
(a) que el indicio (b). Más bien, la diferencia es que en (5) y (e) el indicio es una 
subparte relativamente articulada del patrón de entrada; en otras palabras, el 
buen indicio correspondería a una parte distintamente articulada pero integral en la 
descripción (representación en la memoria) del patrón original. Por otro lado, los 
indicios de recuperación más pobres (c) y (f) comprenden sólo fragmentos no in- 
formativos que no se habrían distinguido ni articulado en la descripción inicial, o 
“codificación”, de los patrones de entrada en la memoria. De hecho, Jos patrones 
como (e) pueden organizarse en nuevos patrones (por ejemplo, en un par de ba- 
rras verticales), cuyas descripciones están completamente en varianza con la des- 
cripcion del patrón de entrada. Así, una noción simple de similitud para la recupe- 
ración requiere de una especificación considerablemente mayor de la represen- 
tación de la entrada y el sondeo como eventos de estímulo interpretados. G. H. 
Bower y Glass (1976) demostraron que las subpartes “buenas” de las figuras sin 
sentido eran casi cinco veces más poderosas que las subpartes ''malas””, como in- 
dicios de recuperación para instigar la memoria de una lísta de figuras que el sujeto 
ha estudiado anteriormente. 

El tercer cuadro ilustra el punto con la memoria verbal. A un sujeto se le puede 
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mostrar una serie de frases, con la palabra a recordar en letras mayúsculas 
(CHOP), mientras que el otro vocablo del contexto (pork) se explica como un po- 
síible auxiliar para recordar la palabra en mayúsculas. Más tarde, la persona recíbe 
una prueba de reconocimiento para las palabras que han de recordarse (vocablos 
con mayúsculas). Una nueva palabra de contexto colocada junto al vocablo que 
debe recordarse predispone su interpretación semántica (significado) para que sea 
la misma o diferente del significado de entrada. Aunque se instruye al sujeto para 
que concentre su decisión acerca de si ha visto antes o no en la lista experimental 
l palabra que ha de recordarse (por ejemplo, CHOP), el vocablo de contexto tie- 
re un fuerte efecto de control sobre la memoria de reconocimiento del sujeto 
(Light y Carter-Sobell, 1970), Específicamente, la palabra CHOP estudiada en el 
contexto pork: CHOP no se reconoce en absoluto cuando se somete a prueba en 
el contexto karate CHOP. La palabra CHOP se codifica o interpreta de distinta for- 
ma en los dos contextos. En este caso, la similitud importante para la decisión de 
reconocimiento es la semejanza del significado más que la identidad de la combi- 
nación física de letras CHOP. Tulving y Thomson (1971) encuentran efectos simila- 
res aun cuando el vocablo que ha de recordarse no parece tener múltiples signi- 
ficados obvios; es como si diferentes palabras contextuales recalcaran selec- 
tivamente distintas características semánticas del vocablo que ha de recordarse, 
Thomson y Tulving (1970) también demuestran que esta codificación en el mo- 
mento de la entrada altera drásticamente la habilidad de ciertas otras palabras para 
instigar el recuerdo de los vocablos a recordar, Por ejemplo, en el caso (g) de la É- 
gara 10.10, después del estudio de una lista de tales pares, si se somete a prueba 
ala persona con el indicio '“comida'* o *“algo para comer”, rápidamente se re- 
cuerda CHOP; pero un indicio como “un golpe impresionante” (relacionado con 
“karate CHOP") no provoca el recuerdo de CHOP. Asf, la interpretación de 
CHOP en el momento de la entrada determina qué estímulos sirven o no como in- 
dicios efectivos de recuperación para la memoria de ese suceso. Éste se refiere a 
un fenómeno que se conoce como especificidad de codificación, que examinaremos 
detalladamente en el capítulo 13. 

Enel cuarto cuadro de la figura 10,10 se ilustra la manera en que el agrupamiento de 
una serle indiferente de dígitos es parte de su descripción característica o represen- 
tación en la memoria. Si una serie como 94582 se agrupa en el momento de la en- 
trada (mediante pausas temporales) en una estructura 2-2-1, esa hilera de dígitos 
implícitos se reconocerá mucho mejor en una prueba posterior de memoria de re- 
conocimiento, que si las series de prueba se agrupan precisamente de la misma 
forma que las series de entrada (Bower y Winzens, 1969). La persona no codifica 
y almacena la serie de entrada como una hilera de dígitos; más bien se trata de una 
secuencia de bloques o grupos, y estos bloques no vuelven a presentarse cuando 
la serie de prueba tiene una estructura de grupo alterada, 

Estos últimos son algumos ejemplos del papel de la recuperación en la memoria; 
1ustran la forma en que el paso de Hóffding puede resbalar y faltar. Aunque los psi- 
cólogos de la Gestalt no estudiaron específcamente este problema, sí señalaron 
su significación y el papel del reconocimiento de estímulo en el recuerdo asocia- 
tivo. Estos problemas se habfan descuidado en las anteriores teorías asociacio- 
nistas de estímulo-respuesta; desde entonces los investigadores le han prestado 
cada vez mayor atención, como puede observarse en la referencias recientes cita- 
das en este capítulo. 
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El olvido eomo desintegración de la huella 

Los gestaltistas también aplicaron sus ideas acerca de la percepción a la desin- 
tegración o modificación de las huellas de la mernoria. Las mismas leyes dinámicas 
de la organización que supuestamente imponen una estructura sobre los elemen- 
tos de un campo perceptual, también tenderían a transformar huellas incoherentes 
y mal organizadas en el transcurso del tiempo, en huellas que muestran mejor 
organización. Por lo tanto, hay fuerzas autónomas que actúan sobre las huellas 
de la memoria para transformar lentamente su contenido de una forma que se 
asemeje más a una buena Gestalt; una estructura simple, bien organizada y esta- 
ble. Si la transformación de la huella fuera demasiado extrema, toda la semejanza 
con una huella inicial desaparecería, de modo que un indicio de recuperación no po- 
dría hacer contacto con una huella así alterada; en términos operacionales, se diría 
que la persona ha olvidado el suceso original. Por otra parte, si la transformación 
autónoma no fuera demasiado extrema, el recuerdo o reproducción de la huetla 
debería revelar distorsiones sistemáticas y progresivas en la dirección de una me- 
jor organización. 

Esta hipótesis fue propuesta e investigada primeramente por Wutf (1922), ps+ 
cólogo Gestalt. Mostró a sus sujetos un conjunto de formas geométricas que de 
algún modo eran incompletas o irregulares; en términos de Wulf, de cierta manera 
se desviaban de una “figura mejor”? obvia, que era más simple, regular y simétri- 
ca. Wulf hizo que sus sujetos reprodujeran (dibujaran) el conjunto memorizado de 
figuras en intervalos semanales sucesivos, e intentaran puntuar sus dibujos en 
cuanto a las distorsiones progresivas y sistemáticas, Afirmaba haber encontrado 
evidencia para las alteraciones progresivas de la reproducción (es decir, huellas de 
la memoria) en da dirección de las buenas figuras Gestalt. 

Debido a la naturaleza sorprendente de tal resultado y a la inquietud que desper- 
taron los gestaltistas, durante los años siguientes proliferaron los experimentos 
diseñados para estudiar ese problema. También se hicieron esfuerzos por exten- 
der los resultados básicos de formas geométricas al recuerdo de historias te- 
máticas (Bartlett, 1932) y a la difusión de rumores dentro de un grupo social 
(Allport y Postman, 1947). En los últimos experimentos que usaban el diseño de 
Wulf, se descubrió una sere interminable de complicaciones y problemas en la 
ejecución e interpretación de tales experimentos: complicaciones para identificar 
la reproducción de un sujeto con su memoria, debidas a reproducciones múltiples 
(al hacer su enésima reproducción de una figura, el sujeto intenta recordar su re- 
producción anterior); complicaciones debidas a la codificación verbal (etiquetación) 
de las figuras de entrada en términos de objetos familiares (**se parece a wn corba- 
tfn'"), y asi sucesivamente. Riley (1963) realizó una esmerada revisión de las in- 
vestigaciones en torno al problema, así como una crítica metodológica de muchos 
experimentos. Este investigador concluye que gran parte de la evidencia empírica 
acerca del tema está terminantemente ex contra de la posición Gestalt. Sin lugar a 
dudas, hay distorsiones en la memoria para formas geométricas (historias o rumo- 
res), pero éstas al parecer son predecibles, no tanto por las tendencias hacia las 
buenas figuras Gestalt sino más bien por: a) asimilación de la memoria de una figu- 
Ta de entrada a un estereotipo cultural común (efecto explicable en términos de in- 
terferencía asociativa); 5) fusión y confusión de dos o más figuras en la lista que se 
memoriza, de modo que al juntar los fragmentos de varias figuras ocurren las re- 
producciones híbridas; o c) por la asimilación de la forma de entrada a la que co- 
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rresponde a una clasificación común (por ejemplo, ““corbatín””) usada en el mo- 
mento de la entrada, que codifica las distorsiones de la reproducción de la forma 
de un modo relativamente constante durante intervalos variables de retención. El 
resultado es que el análisis Gestalt de Wulf acerca de tales cambios en la memoria 
se ha reemplazado por un análisis asociativo más perfeccionado y firmemente apo- 
yado de los fenómenos, 

Otra concepción del olvido-expresada por los psicólogos Gestalt (Kóhler, 1929, 
1941) es que ua huella puede distorsionarse mediante sus interacciones con una 
gran cantidad de huellas relacionadas similares a ella. La idea es que una huella A 
sería más distorsionada por las huellas B, C, D,... cuanto más similares fueran los 
procesos perceptuales que subyazcan a A y a las otras huellas. Esta interpretación 
era su forma básica de explicar por qué la interferencia asociativa en los experi- 
mentos del olvido se relacionaba con la similitud entre el material de interferencia 
y el material a recordar, Los experimentos de Von Restorff (1933) y de Kóhler y 
Von Restorff (1935) demostraron este efecto de la similitud sobre la memoria para 
un solo reactivo dentro de una lista. Von Restorff comprobó que parte de la difi- 
cultad de aprender una lista de sílabas sin sentido (como pares asociados) proviene 
de la homogeneidad de la misma; las sílabas no son distinguibles y se confunden 
unas con otras. Sin embargo, si se hace que un reactivo resalte perceptualmente 
al presentarse en letras rojas o en un tipo de imprenta diferente, o está hecho con 
distintos materiales (dígitos en vez de sílabas), entonces ese reactivo único se re- 
cuerda mejor que los otros, 

Pueden usarse diversas formas para distinguir un reactivo del resto de una lista 
homogénea a ser aprendida, y todas producen alguna mejoría en la memoria para 
el reactivo distinto, Á esto se le ha llamado efecto de Von Restarff, en honor de su 
descubridor. 

¿Cómo se explica elefecto de Von Restorff? Kóhler y esta investigadora conce- 
bían el reactivo único en el sentido de que resaltaba de todos los reactivos homo- 
géneos, como una figura contra un fondo, Ál ser así distinguido, la huella impresa 
para el reactivo único estaría aislada de las huellas de los reactivos restantes y, 
por lo tanto, no se distorsionaría por las interacciones con esas huellas, Las ex- 
plicaciones del efecto de Von Restorff realizadas par los asociacionistas de estí- 
mulo-respuesta siguen líneas similares, al emplear conceptos de generalización 
del estímulo e interferencia asociativa. En otras palabras: como el estímulo del par 
aislado es único se confunde menos con otros estímulos de la lista, reduciendo los 
errores generalizados al par único. Como factor adicional, se ha descubierto que 
los reactivos únicos tienen una ventaja en la memoria, ya que generalmente se les 
presta atención y se les repite mejor que a los reactivos homogéneos de control 
(Rundus, 1971). 

Asimismo, en las pruebas de recuerdo libre la característica distintiva del reactivo 
único (por ejemplo, letras rojas) puede servir como indicio original de recupera- 
ción para la palabra, mientras que la característica física de los reactivos homogé- 
neos de fondo (letras negras) está conectada con respuestas múltiples de interfe- 
rencia. 

Independientemente de la forma en que los teóricos asociacionistas analicen el 
electo de Von Restorff, los experimentos originales fueron motivados por la verifi- 
cación de algunas ideas Gestalt acerca del olvido. 
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Memorización mecánica versus comprensión 


Uno de los principios básicos de Wertheimer y de otros psicólogos de la Gestalt 
es que la memorización mecánica (el aprendizaje de materiales sin sentido me- 
diante la repetición), constituye una forma ineficiente del aprendizaje, raras veces 
usada en situaciones de la vida real. Afirmaban que en la vida cotidiana las perso- 
nas aprendían la mayor parte de las cosas al entender o comprender el significado 
de algún suceso, o al captar el principio que sustenta a una secuencia de episodios. 
La memorización mecánica es una estrategia ineficiente, que se adopta en pacos 
casos como último recurso (por ejemplo, en el aprendizaje de una lista de sílabas 
sin sentido que presenta el psicólogo), cuando el significado y los factores natu- 
rales de organización están ausentes. 

La investigación de Katona (1940), publicada en su libro Organizing and memo- 
rizing, proporcionó varias ilustraciones de las diferentes propiedades que caracte- 
rizan a las tareas aprendidas por repetición, y a aquellas aprendidas mediante la 
comprensión de un principio o regla. Los experimentos de Katona estaban dise- 
ñados de tal modo que era posible someter el mismo material a la memoria con 
comprensión o sin ella, y entonces efectuar una prueba de la retención posterior o 
de la transferencia a una tarea nueva y similar, 

Para ilustrar esos principios, se podría pedir a los sujetos que estudiaran y 
aprendieran la serie de números 816449362516941, a la serie de letras 
REKAEPSDUOL. La mitad de los sujetos aprendía las series por repetición; a 
los otros se les darían varias pistas acerca de un principio o regla que sustenta la 
generación de las series (pensar en números al cuadrado a en palabras escritas al 
revés). Aquellos sujetos que “*deducían”” la regla para generar la serie (que ““enten- 
dían su significado'*, para emplear los términos de Katona) eran capaces de repro- 
ducirlas mejor que sus compañeros de memorización mecánica, tanto en una prueba 
de retención inmediata como en una demorada. Además, una vez que un estu- 
diante había captado el principio generador de la serie, era capaz de transferir su 
conjunto de solución de problema a nuevas tareas que implicaban problemas pare- 
cidos. Así, al haber “solucionado” los problemas antes ilustrados, el sujeto podía 
aprender con rapidez (exhibir *“transferencia positiva'' a) una nueva serie como 
256225196169144 o YRTSIMERCOITB. Katona utilizó varias tareas de resolu- 
ción de problemas y procedimientos de aprendizaje, para ilustrar los puntos que 
relaciona el aprendizaje-con-comprensión con un aprendizaje más rápido, mayor 
retención y una transferencia superior del aprendizaje a tareas similares, 

Los resultados básicos en el tipo de experimentos de Katona son irrefutables. 
Pero persiste un problema: cómo caracterizar científicamente a los resultados, En 
retrospectiva, parece que el sujeto que dispone de la regla (ya sea porque la des- 
cubrió o porque se le explicó) tiene una descripción o representación mucho más 
simple de las series a memorizar. Es decir, la serie se caracteriza esencialmente 
por ser una transformación o reordenación simple de algo que ya es familiar y bien 
conocido (por ejemplo, **deletrear LOUDSPEARKER al revés””). Por lo tanto, al 
usar el material conocido, el número total de nuevas cosas (asociaciones) por 
aprender es mucho más pequeño que si el problema se ataca al nivel de la memori- 
zación mecánica. Por la misma razón, una serie aprendida mediante una regla se 
retendrá mejor semanas más tarde porque tiene menos elementos y relaciones 
por recordar, y éstos están mejor organizados que en el caso de la memoria me- 
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cánica. Lo que varía en ambos casos es la descripción interna de la serie de 
estímulos que han de aprenderse: una es sucinta, compacta, significativa; la otra 
es larga, torpe, sin sentido. Aunque Katona no hubiera estado de acuerdo con esta 
caracterización del problema, los experimentos sirven para ilustrar el interés de la 
Gestalt por la forma en que la organización real del campo perceptual hace contac- 
to con los recuerdos anteriores. 

Alo largo de los años han aparecido más demostraciones de que el hacer que la 
persona aprenda (o **vea””) una regla o principio para generar el material, da lugar 
aun aprendizaje mucho más rápido que si se trata a dicho material como una colec- 
ción de reactivos independientes y no relacionados. Para una revisión de algunos 
de estos trabajos, véase G. H. Bower (1970b, 19720). Nunca se ha puesto en duda el 
hecho básico de que la comprensión fomenta el aprendizaje y la retención. Se dudaba 
de la interpretación de la comprensión (¿qué denota eso para un conductista?), y 
de si la relación de la comprensión con el aprendizaje tiene la importancia revo- 
hucionaria que se le atribuyó alguna vez. Por desgracia, los gestaltistas y los psicó- 
logos E-R se enfrascaron en disputas acerca de las prácticas educativas (recuér- 
dese que Thorndike, un teórico de la educación, propuso ejercicios de “grabar en 
la memoria””), y en apariencia estaban en desacuerdo sobre si apoyar la enseñanza 
por ejercicios repetidos o por comprensión. Aunque el problema subsiste un tanto 
hoy en día en las escuelas de educación, los psicólogos han solucionado la contro- 
versia al obtener una representación cada vez mejor de lo que se aprende en dife- 
rentes casos, de modo que pueden evitarse las prescripciones conflictivas. En las 
tareas que tienen principios sustentadores, el maestro obviamente enseña la res- 
presentación más simple del problema y las reglas para generar la solución; pero si 
hay varias tareas con principios y procedimientos diferentes, entonces se requiere 
de algún ejercicio repetitivo para aprender esas descripciones de nivel superior. 


Solución de problemas y discernimiento 


Ahora se examinará brevemente el trabajo de los gestaltistas acerca del pensa- 
miento productivo, la solución de problemas y el discernimiento. Se recordará que 
los experimentos de Kóhler con simios suscitaron controversias porque éste su- 
ponía que cuando el mono se enfrentaba a una dificultad trataría implícitamente de 
“pensar a fondo*' la solución del problema *“en su cabeza” antes de responder 
abiertamente. El discernimiento podría caracterizarse como una actividad implícita 
de solución acertada de problemas. Basado en su análisis de la evidencia fotográfi- 
ea de la conducta de los monos relacionada con solución de problemas, Siguiendo a 
Kóhler, Yerkes (1927), planteó los siguientes tipos de criterios conductuales del 
discernimiento: 


En mestros actos ejecutados con discernimiento o comprensión de las relaciones de los 
medios con los fines, estamos familiarizados con ciertas características de importancia, 
cuando no son diferenciales, Á continuación se ofrece una lista parcial de los rasgos de esa 
conducta. La presentamos con la idea de que el estudio comparativo de la conducta y el 
discernimiento, en distintos organismos, podría revelar características comunes: 

1. El reconocimiento, la inspección a el examen persistente de la situación problemá- 
tica; 2. el titubeo, pausa, actitud de atención concentrada; 3. el ensayo del modo de res- 
puesta más o menos adecuada. 4. en el caso de que el modo inicial de respuesta sea inade- 
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cuado, el ensayo de alguna otra forma de respuesta, cuando la transición de un método a 
otro es clara y a menudo repentina; 5. la atención persistente o reiterada al objetivo o 
meta y a la motivación respectiva; 6. la aparición del punto crítico en ej cual el organismo 
ejecuta el acto adaptativo requerido repentina, directa y definitivamente; 7. la rápida re- 
petición de la respuesta adaptativa, después de que se ha dado una vez. 8. la notable habi- 
lidad para descubrir y atender el aspecto y la relación esenciales de la situación proble- 
mática y para descuidar, relativamente, las variaciones en las no esenciales (Yerkes, 
1927, pág. 156). 


Los análisis subsiguientes de la solución de problemas en los primates y otros 
mamíferos demostraron que se trataba de un conjunto bastante complejo de hábitos 
pasados unidos a varias estrategias aprendidas para ensayar hipótesis. Por ejern 
plo, un mono experimentado tiene más probabilidades de arribar a una solución de 
discernimiento a un problema, que un simio no experimentado. La experiencia con 
el uso de varas como herramientas, o de cajas como escaleras para trepar permite 
aun chimpancé resolver problemas futuros utilizando estas habilidades componen- 
tes (Birch, 1945). La diferencia entre las teorías de la asociación y de la Gestalt 
reside en que las primeras sostienen que la experiencia pasada necesaria garantiza de 
algún modo la solución. Aunque los teóricos Gestalt estarían de acuerdo con que la 
experiencia facilita la solución, se Oponen a las explicaciones en términos del uso 
de no discernimiento de la experiencia previa sin tener en cuenta la organización. 
Se requiere algo más que la cantidad necesaria de información; así, el hecho 
de conocer las palabras suficientes no nos capacita para escribir un poema. Dicho de 
otro modo, la experiencia por sí sola no soluciona el problema. 

Un segundo hecho que rápidamente se hizo manifiesto en investigaciones subse- 
cuentes es que algunos arreglos experimentales son más favorables que otros 
para fomentar las soluciones de discernimiento, Ambas hipótesis inherentes en el 
organismo y en la estructuración perceptual del medio ambiente, contribuyen a la 
organización. El discernimiento es más probable cuando la situación problemática 
está dispuesta de tal forma que todos los aspectos necesarios están abiertos a la 
observación, Además, las soluciones aparecen con mayor rapidez si todas las par- 
tes que deben intervenir en la relación se presentan simultáneamente en la percep- 
ción; por ejemplo, a un mono le resulta más difícil aprender a usar una vara que 
esté colocada en la jaula al otro lado de la comida, que aprender a utilizar una que 
se encuentre cerca del alimento Jackson, 1942). 

Un desarrollo significativo de la investigación del discernimiento fue el de 
Harlow (1949) acerca de la disposición de aprendizaje en los manos. En un estudio 
previo, entrené a monos en un gran número de problemas de discriminación de 
objeto, cada uno de los cuales sólo implicaba seis ensayos, donde la elección de un 
objeto dado de un par se recompensaba con una pasa de uva. Cada problema abar- 
caba un par distinto de objetos comunes como una taza, un caja, Un peine, un zapa- 
to. En el curso de las sesiones de alrededor de 350 problernas, Harlow observó 
que los monos se convertían en aprendices mucho más rápidos. Sus resultados se 
muestran en la figura 10.11, que presenta el porcentaje de respuestas correctas 
dentro de los seis ensayos, mientras los animales aprendían otro par de objetos 
antes de cambiar a un nuevo par. Las discriminaciones iniciales (desde el problerna 
1 hasta el 8) exhiben mejoramiento gradual dentro de los seis ensayos en un pro- 
blema; además, al acumular experiencia, los monos se volvían muy adeptos a re- 
solver problemas posteriores. En el último bloque de problemas que se traza en 
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elección del objeto recompensado que salta a aproximadamente 97% a raíz del pri- 
mer ensayo. Se ha informado de resultados similares de disposición de aprendizaje 
en todas las especies, con diversas reglas para reforzar las elecciones. 

La importancia de los experimentos de aprendizaje de Harlow reside en su de- 
mostración de que “*... los animales pueden aprender discernimiento gradualmen- 
te”* (Harlow, 1949, pág. 56). Así, no es necesario que exista una oposición funda- 
mental entre las teorías que recalcan el aprendizaje gradual y las que destacan el 
aprendizaje de discernimiento. Harlow proponía que mediante la práctica los ani- 
males paulatinamente aprenden a eliminar hipótesis extrañas que conducen a erro- 
res. Así, un mono podría aprender a no prestar atención a la posición de izquierda 
y derecha del objeto recompensado, a no escoger un objeto que no fuera reforza- 
do, etcétera. El animal poco a poco adquiriría la estrategia: “Si el objeto escogido 
es recompensado, elegirlo la próxima vez; si el objeto escogido no se recompen- 
sa, cambiar al otro la próxima vez”*. El predominio de esta estrategia sobre las hi- 
pótesis erróneas explicaría el aprendizaje intraproblema tan rápido que muestran 
los monos entrenados. Sin embargo, la habilidad de aprendizaje rápido es espe- 
cfíica de una regla; es decir, que un objeto particular de un par siempre es recom- 
pensado. Si la regla del reforzamiento se modifica de manera considerable (por 
ejemplo, se refuerzan las respuestas a posiciones alternativas independientemen- 
te de las ubicaciones de los objetos), entonces los monos entrenados al objeto 
muestran de nuevo un aprendizaje muy lento. Levine (1965, 1969) desarrolló una 
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teoría específica de comprobación de hipótesis que explica la mayor parte de esos 
resultados de disposición de aprendizaje. Sin embargo, en perspectiva histórica, el 
trabajo acerca de las disposiciones del aprendizaje y la visión de comprobación de 
hipótesis del aprendizaje de discriminación constituyeron un desarrollo temático 
de las concepciones iniciales de la Gestalt acerca de la solución de problemas por 
discernimiento. 


Pensamiento productivo 


Durante muchos años Wertheimer dictó conferencias acerca de los procesos del 
pensamiento, pero sólo publicó unos cuantos artículos fragmentarios a lo largo de 
su Vida, Sin embargo, poco antes de morir terminó el manuscrito de un pequeño li- 
bro, que fue editado por sus amigos y apareció con el título de Productive thinking 
(1945, 1959), En esta obra resume, con su estilo característico, algunos estudios 
experimentales, mediante el penetrante análisis cualitativo de las situaciones sim- 
ples que sirven para ¡lustrar las diferencias entre su propio enfoque y otros con los 
cuales disentía. 

Las dos alternativas fundamentales que compiten para la adopción del enfoque 
gestaltista del pensamiento y la solución de problemas son, por una parte, la 
lógica formal y, por otra, la teoría de la asociación. Supuestamente estas dos op- 
ciones son demasiado limitadas para abarcar lo que en verdad ocurre cuando un 
individuo que se enfrenta a un problema encuentra una solución razonable. 

Se establece una distinción entre una solución ciega, en la cual el aprendiz aplica 
una fórmula, y otra razonable, en la que el sujeto comprende lo que hace en rela- 
ción con la estructura esencial de tal situación. Con frecuencia, la solución ciega es 
una desafortunada aplicación de la fórmula a una situación que no se ha considerado 
inadecuada. Se citan experimentos, por ejemplo, en los que a niños en edad es- 
colar se les enseña a encontrar el área de un paralelogramo, bajando líneas per- 
pendículares a la base desde las dos esquinas superiores, para convertir asía la f- 
gura en un rectángulo, cuya área es fácil de calcular. Sin embargo, los niños que 
habían repetido a la perfección los ejemplos, se confundieron cuando se les mostró 
un paralelogramo colocado en una posición distinta, de modo que los pasos 
*“correctos'” del procedimiento llevaron a resultados erróneos: los niños habían 
aprendido la solución de acuerdo con un procedimiento ciego. En contraste, se in- 
formó de la solución encontrada por una niña de cinco y medio años de edad: 


Una vez presentado el problema del paralelogramo, después de que se le había demos. 
trado a grandes rasgos cómo obtener el área del rectángulo, la niña dijo: ““Desde luego 
que no sé cómo se hace esto””. Y tras 1m momento de silencio, indicó: *esto no está bten 
aquí”, señalando el extremo izquierdo de la figura; **y esta otro tampoco está bien aquí”, 
indicando el extremo derecho (fig. 10,12). ''Esto molesta aquí y acá”, dijo titubeando, 
“podría quedar bien aquí... peto...”* Y súbitamente exclamó: *' ¿podrían darme unas tije- 
ras? Lo que está mal allí es exactamente lo que se necesita aquí. Encaja””. Tomó las tije- 
ras, cortó verticalmente y puso el extremo izquierdo en el lado derecho (tg. 10.13) 
(Wertheimer, 1945, pág. 48). 


Otro niño, al que se le dio un paralelogramo largo cortado en un pedazo de pa- 
pel, desde el comienzo señaló que toda la parte media era correcta, a excepción de 


ra y 
figura 10.12. Partes problemáticas en el intento del niño TE ? 
para aplicar la teoria del rectángulo al paralelogramo ([to- | £- je 


mada de Wertheimer, 1959). Sm pS 


los extremos. De repente tomó el papel y formó un anillo. Vio entonces que esta- 
ba en lo cierto, pues podía cortarlo verticalmente en cualquier parte y convertirlo 
enun rectángulo, 

En casos como éstos, las soluciones aparecen de forma ordenada, de acuerdo 
con la verdadera '“estructura” de la situación. Éste es el enfoque estructural que 
destaca Wertheimer. Los niños captan con facilidad tales soluciones '“estructura- 
ks'' a no ser que se les enseñe mal, en una atmósfera de ejercicios repetitivos 
ciegos. Con formas como las que aparecena la izquierda y a la derecha en la figura 
10.14, Jos niños están en condiciones de separar con facilidad las que pueden re- 
solverse de las que no. Es fútil argumentar —dice Wertheimer— que esta discrimi- 
nación se realiza con base en la familiaridad, como al parecer creen los asociacio- 
nistas. Los niños hacen las distinciones porque conocen la naturaleza esencial de la 
solución. Los aspectos estructurales y los requerimientos de la situación misma 
establecen dimensiones y esfuerzos que llevan a un adelanto; es decir, a la solu- 
ción del problema. 

Las implicaciones del punto de vista de Wertheimer en la enseñanza son muy 
claras. Siempre es preferible proceder de modo que se favorezca el descubrimien- 
to de la naturaleza esencial de la situación problemática, de los vacíos que necesi- 
ten llenarse, de manera que, aun a costa de la elegancia o de la brevedad, la prue- 
basea “orgánica”? en lugar de '“mecánica”” (Duncker, 1945). 


APRECIACIÓN DE LA TEORÍA GESTALT DEL 
APRENDIZAJE 


La teoría Gestalt y los problemas usuales del 
aprendizaje 


Los psicólogos Gestalt perciben un énfasis un tanto distorsionador en los trata- 
mientos convencionales del aprendizaje, de modo que las dificultades que general- 
mente se recalcan no constituyen la selección más natura! de los problemas. En 
este sentido, la posición Gestah acerca del aprendizaje puede resumirse de la ma- 
nera siguiente: 


ES 


Figura 10.13. Solución del niño al problema del paralelogramo con el uso de tijeras 
[tomada de Wertheimer, 1959). 
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Figuras A Figuras 8 


Figura 10.14. Aplicabilidad de la 
solución al problema del parale- 
logramo en nuevas figuras. Es po- 
sible cambiar las figuras A de 
modo que puedan formar rectán- 
gulos. No se puede hacer lo mis- 
mo con las figuras B. Se dice que 
la capacidad de los educandos 
para resolver las figuras A y re 
chazar las 8 depende de alguna 
cosa distinta de familiaridad con 
las figuras (tomada de Werthei- 
mer, 1959). 


1. Práctica. Supuestamente nuestros recuerdos son huellas de percepciones; 
la asociación es un producto secundano de la organización perceptual. Las leyes 
de los agrupamientos perceptuales también determinan la coherencia de los ele- 
mentos en la memoria. La repetición de una experiencia se acumula sobre las ex- 
periencias anteriores sólo si el segundo evento se reconoce corro una recurrencia 
del anterior, Las exposiciones sucesivas a una situación de aprendizaje proporcio- 
nan al aprendiz oportunidades reiteradas para que observe nuevas relaciones que 
sostengan la reestructuración de la tarea. 

2. Motivación. Los psicólogos de la Gestalt aceptaron la ley empírica del efecto, 
acerca del papel de las recompensas y de los castigos, pero diferían de Thorndike 
en la interpretación de la misma. Creían que los efectos secundarios no actuaban 
“de modo automático e inconsciente” para fortalecer los actos previos. Más bien, 
el efecto tenía que percibirse como perteneciente al acto previo, una posición que 
Thorndike también destacaba. La motivación consistía en colocar al organismo en 
una situación problemática; las recompensas y los castigos actuaban para conáir- 
mar o desconfirmar las soluciones propuestas a los problemas, 

3. Comprensión. Los autores gestaltistas ponen el acento en la percepción de 
las relaciones, en la conciencia de las relaciones entre las partes y el todo, de los 
medios con las consecuencias. Los problemas deben resolverse de manera razo- 
nable, estructural y orgánica, en lugar de hacerlo de forma mecánica y tonta, o por 
repetición de hábitos anteriores, Por eso, el aprendizaje por discernimiento es 
más usual en las tareas de aprendizaje presentadas apropiadamente que en el mé- 
todo de ensayo y error. 

4. Transferencia. El concepto gestaltista más parecido al de la transferencia es 
la transposición. Un patrón de relación dinámica descubierto o comprendido en una 
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siriación es aplicable a otra, Hay algo en común entre el aprendizaje anterior y la 
situación en la cual se encuentra la transferencia, pero lo que existe en cormín no 
son elementos divididos idénticos sino patrones comunes, configuraciones o rela- 
ciones. Una de las ventajas del aprendizaje por comprensión comparado con el de 
repetición es que el entendimiento puede trasponerse a más amplias variedades 
de situaciones, y conduce con menor frecuencia a aplicaciones erróneas del apren- 
dizaje antiguo. 

5. Olvido. El olvido se relaciona con el curso de los cambios en la huella. Las 
huellas pueden desaparecer por el gradual decaimiento (una posibilidad difícil de 
probar o de refutar), por la destrucción debida a que formen parte de un campo 
caótico y mal estructurado, o por asimilación a los procesos o huellas nuevos. La 
última posibilidad es familiar como una forma de inhibición retroactiva. En uri mo- 
mento dado, les huellas que contimían existiendo pueden no estar disponibles a 
causa del fracaso momentáneo en el paso de Húfíding. 


Además de tal olvido, se cuentan los cambios dinámicos que ocurren en el re- 
cuerdo, de modo que lo que se produce no es el aprendizaje anterior en el que fal- 
tan algunas partes, sino una huella distorsionada en la dirección de una buena Gestalt. 


Aspectos generales de la teoría Gestalt 


Al discutir la teoría de la Gestalt sólo como teoría del aprendizaje se han pasado 
por alto algunas de sus características más generales, en especial su orientación 
filosófica y su relación con la biología. La objeción a la teoría asociacionista del 
aprendizaje es parte del énfasis holístico dentro de la teoría general, y es coheren» 
te con la oposición Gestalt a las explicaciones atomicistas acordes a las conexiones 
entre las partes. La objeción a las sensaciones como elementos de la percepción 
(la hipótesis del haz) está comprendida en la objeción a las conexiones de estímulo- 
respuesta como elementos de los hábitos. 

El punto de vista fenomenolágico, establecido muchas veces por los psicólogos 
gestaltistas como contrario a la posición positivista dominante, no es fácil de carac- 
terizar satisfactoriamente. La observación fenomenológica es más subjetiva que el 
conductismo y menos analítica que la introspección que Titchener proponía. La 
clase de observación recomendada es naturalista y apreciativa más que analítica. 
Por ejemplo, las explicaciones posteriores de Kóhler acerca del discernimiento 
dependían de tal descripción fenomenológica de los eventos. 

La interpretación de la psicología Gestatl como teoría de campo se basa en gran 
parte en la evidencia presentada por Kóhler en su Physische Gestalten (1920), que 
muestra la relación entre las leyes Gestalt de la organización y los principios bien 
establecidos en la física y en la biología. 

Como hemos dicho, los psicólogos Gestalt se interesaban principalmente en los 
procesos de la percepción y en los cognoscitivos (solución de problemas). Por 
consiguiente, su enfoque del aprendizaje y de la memoria ponía el acento en una 
combinación de estos factores en las situaciones de aprendizaje; la forma en que la 
memoria reflejaba la organización perceptual y la manera en que las habilidades de 
resolución de problemas intervenían en la comprensión de una tarea de aprendi- 
zaje, enla reconstrucción de un recuerdo vago o enla transferencia de un principio 
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del aprendizaje a una nueva situación. Estos énfasis constituyeron antídotos y re- 
tos apropiados para el asociacionismo £-R que dominaba en Estados Unidos. 


La psicología de la Gestalt en la actualidad 


La inquietud que provocó la introducción de la psicología de la Gestalt en Esta- 
dos Unidos a fines de la década de los veinte y comienzos de los treinta amainó 
considerablemente en la década de los cincuenta. Pero todavía hay muchos ele- 
mentos válidos en lo que enseñaron los psicólogos clásicos de la Gestalt. Sus es- 
critos tienen diversas características: una parte experimental o demostrativa en la 
que se presenta uno u otro fenómeno psicológico; después, una parte de polémica 
casi filosófica en la cual se discute hasta el agotamiento el elementalismo antiguo 
de los análisis de Titchener (o de Watson) y, por último, se expone alguna teoría 
de campo relativamente incomprensible de los fenómenos. En la psicología senso- 
rial los gestaltistas hacían valer fácilmente sus puntos de vista; sus datos se expli- 
caban y se aceptaban en términos menos pomposos, y su enfoque del área progre- 
saba. Así, en el dominio de la percepción sensorial, los fenómenos demostrados 
de la psicología Gestalt ingresaron a la corriente principal. En el área del aprendi- 
zaje, a raíz de los experimentos de Katona en 1940, se realizaron relativamente 
pocos trabajos experimentales desde el punto de vista de la Gestalt. Ninguno de 
los gestaltistas se dedicó al estudio del condicionamiento y del aprendizaje animal, 
que eran las ramas de investigación que acaparaban el interés de los teóricos del 
aprendizaje durante e) periodo comprendido entte 1930 y 1960. 

En la década de 1960 se produjo un resurgimiento del interés en el enfoque 
Gestalt del aprendizaje humano. Una de estas líneas de investigación, la de Asch y 
sus colaboradores, ya comentada, se refiere a la forma en que la organización per- 
ceptual influye en la coherencia de los elementos en la memoria. Estas demostra- 
ciones, junto con el trabajo de Bower y sus asociados, mantuvieron en primer 
plano la idea de que la asociación es la relación de elementos, y que la contigitidad 
es tan sólo una condición previa dentro de la cual operan otras relaciones. Otra 
idea que ha probado su utilidad en los anábsis del aprendizaje humano es la noción 
de la unificación, o formación de ““blaques'' de elementos discretos en una unidad 
integrada, 

A fines de la década de los sesenta el punto de vista organizacional del aprendi- 
zaje humano ganó varios importantes defensores (Bower, 1970c; Mandler, 1967, 
1968; Tulving, 1968). Este punto se revisará más profundamente en el capítulo 
13, La concepción organizacional de la memoria se asemeja mucho a ciertas pre- 
misas de la psicología Gestalt, en particular a las que explorara Katona. Gran parte 
de las investigaciones en esta área del aprendizaje verbal se realizaron sobre el re- 
cuerdo libre, un arreglo experimental en el cual se expone al sujeto a un conjunto 
amplio de reactivos (por ejemplo, sustantivos comunes), y se le pide que recuerde 
tantos como pueda, en cualquier orden. Á primera vista, no es claro cómo una teo- 
ría de estímulo-respuesta-asociación puede comenzar a analizar la ejecución en la 
tarea de recuerdo libre (para ilustrar la manera de hacerlo, véase un modelo de J. 
R. Anderson, 1972). No obstante, los teóricos organizacionales (por ejemplo, 
Mandler, 1968) suponen que el sujeto en recuerdo libre trata de relacionar los 
reactivos individuales en unidades o bloques subjetivos, que sirven como grupos 
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efectivos que se aglutinan en el recuerdo. Este se encuentra limitado por el núme- 
ro constante de bloques y el número de reactivos que pueden ocurrir en un bloque 
(aunque una unidad de memoria puede contener otros bloques para permitir el in- 
crustamiento de bloques dentro de bloques; Mandler, 1967). Los bloques adopta- 
dos para listas de palabras generalmente son categorías semánticas, De hecho, 
Tulving (1962) encuentra correlaciones muy elevadas entre la cantidad recordada 
y las mediciones de organización subjetiva en el protocolo de recuerdo. Los proce- 
dimientos que intentan facilitar la organización estable de los reactivos de la 
lista —o interferir con ella— producen incrementos o decrementos correspondientes 
en h cantidad evocada (Bower, Lesgold, y Tieman, 1969). En el caso de que el núme- 
ro de unidades subjetivas resulte may or que el óptimo, supuestamente la persona ca- 
tegoriza de nuevo sus bloques en un número menor de categorías de clase supe- 
nor, que está dentro del límite de la memoria (Mandler, 1968). Entonces, se supone 
que en la evocación la persona tiene acceso inmediato a las categorías superiores a blo- 
ques, que desempaca dentro de sus unidades subordinadas durante el acto de evo- 
car. Como Bower, Clark, Winzens y Lesgold (1969) han demostrado, ésta es una 
eficiente estrategia de recuerdo cuando el material la permite. Las investigaciones 
wteriores acerca del tema se compilaron en un volumen de reseñas, Organization 
of memory, editado por Tulving y Donaldson (1972). 

Las ideas de la teoría de la Gestalt todavía viven en la teoría del aprendizaje. Jun- 
to con el énfasis en los factores perceptuales de la memoria y los factores organi- 
zacionales en el recuerdo libre, J. R. Anderson y Bower (1972b) han contrastado 
una Gestalt con un análisis ““elementalista”” acerca de la forma en que una persona 
puede aprender y recordar oraciones significativas. La cuestión es si el recuerdo 
de una proposición puede descomponerse en un número de relaciones asociativas 
muasiindependientes, o si la proposición completa organiza todos sus ejementos en 
un solo bloque que se recuerda de un modo de todo o nada. Sin embargo, la evi- 
dencia es conflictiva y no apoya con claridad ni las ideas de asociaciones múltiples 
ni las del bloque unitario (véase la revisión en J. R, Anderson, 1976). 

En general, la psicología de la Gestalt tuvo en efecto estimulante y saludable so- 
bre el estudio del aprendizaje y la memoria. Sus ideas acerca del aprendizaje 
humano terminaron por ser apreciadas y aprovechadas a comienzos de la década 
de los setenta. De modo similar, los estudios Gestalt acerca del pensamiento y la 
solución de problemas, en particular los trabajos de Duncker (1945) y de Werthei- 
mer (1945, 1959) fueron estimados otra vez por científicos como Allen Newell y 
Herbert Simon (1972), quienes trabajaron en la simulación de solución de problemas 
mediante computadora, Así, la fluencia de un pequeño grupo de psicólogos ges- 
taltistas alemanes ha perdurado más allá de su muerte. En realidad, estos psicó- 
logos constituyeron los antecedentes intelectuales de gran paste de lo que se 
conoce hoy en día como psicología cognoscitivista, que en la actualidad es un punto 
de vista dominante en la psicología experimental de los Estados Unidos. 


LECTURAS COMPLEMENTARIAS 
Éstos son los libros de los **tres grandes” de la psicología de la Gestalt: 


Koffka, K., Growth af the mind, 1924. 
Kofíka. K., Principles of Gestalt psychology, 1935. 
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Kóhler, W., The mentality of apes, 1925. 
Kóhler, W., Gestalt psychology, 1939 y 1947. 
Kóhler, W., Dynamics in psychology, 1940. 
Wertheimer, M., Productive thinking, 1945 y 1959. 
Para una exposición favorable aunque crítica de la psicología de la Gestalt, véase: 


Prentice, W.C.H., “The systematic psychology of wolígang Kóhler””, en S. Koch (dir.), 
Psychology: A study of a science, vol. 1, 1959, págs. 427-455. 


Una buena serie de lecturas, incluyendo varios artículos clásicos traducidos del alemán: 


Henle, M., Documents of Gestalt psychology, 1961. 
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El aprendizaje de 
SIgnos, 


de Tolman 


La teoría de Edward C. Tolman (1886-1959) se denominó conductismo propo- 
sitivo en su principal trabajo sistemático, Purposive behavior in animals and men 
(1932). Más tarde, el propio autor y otros investigadores le llamaron teoría de sig- 
no Gestalt o de la expectancia. Estos últimos términos ponen de relieve su natu- 
raleza cognoscitiva, que en ciertos aspectos la distingue de las teorías de estí- 
mulo-respuesta de Thorndike, Guthrie, Skinner y Hull. La designación aprendi- 
a0je de signos Constituye un nombre satisfactorio y breve. 

Tolman era conductista, pero de un tipo completamente distinto del de Watson, 
Paslov o Guthrie. Estaba interesado en saber cómo la teoría de la conducta hacía 
contacto con nociones tales como conocimiento, pensamiento, planeación, interfe- 
rencia, propósito e intención. Era una especie de conductista lego, que a menudo 
describía el comportamiento de un animal en términos de sus motivos, pizcas 
(bits) de conocimiento (cogniciones), expectativas, intenciones y propósitos, de 
wa forma muy parecida a como un lego inteligente describiría la conducta de otra 
persona. El principal aporte de Tolman fue su oposición a ciertas premisas restric- 
tivas —que en parte Ccontrarrestó—, adoptadas por $us antecesores y contem- 
poráneos estrictamente conductistas. No era un sistemático, sino un observador 
muy agudo del comportamiento animal, y un crítico de la teoría del reforzamiento 
E-R que predominaba en su época. La medida de su éxito se percibe en la manera 
en que las teorías de sus oponentes (en especial la de Hull; véase el capítulo 5) se 
vieron obligadas a reconocer y a tratar los fenómenos y las distinciones concep- 
tuales que Tolman proponía. ] 

A pesar de algunos cambios en el vocabulario, durante su carrera Tolman se 
mantuvo firme en sus posiciones fundamentales. Creía que la conducta debería 
analizarse en el nivel de las acciones, no de los movimientos; que estaba dirigida a 
una meta y que era dócil y variaba de acuerdo con las circunstancias ambientales 
en la búsqueda de una meta dada. Veamos más de cerca estos principios. 
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LA CONDUCTA COMO ACCIONES 
DIRIGIDAS A UNA META 


Tolman argumentaba que la conducta se describe mejor en términos de accio- 
nes con un propósito y una meta. Decimos que alguien compra un disco, bebe un 
refresco, marca un número telefónico, etc., y no nos molestamos en mencionar 
los movimientos que tales acciones implican. La consecución de una meta o estado 
fina) —y no la secuencia de crispamientos musculáres espasmódicos que conducena 
la meta— debe convertirse en la unidad de análisis del psicólogo. En efecto, éste 
es el nivel de descripción conductual del vocabulario común que el lego aplica a las 
acciones. 

La docilidad de la conducta significa sólo que ésta es adaptable a las cambiantes 
circunstancias, y que el modo de conseguir algún fin varía según los medios dispo- 
nibles. Si usted no puede ir al mercado, en su automóvil, puede tomar un autobús, 
pedirle a alguien que lo lleve, ir en bicicleta o caminar. La conducta escogida no es 
una respuesta refleja a la meta, sino que varía adaptativamente de acuerdo con las 
limitaciones de la situación. Esto significa en particular que un organismo puede 
emplear su conocimiento de las sendas en el espacio, de las herramientas y de los 
obstáculos para integrar una solución totalmente nueva e imaginativa que permita 
llegar a una meta obstruida. 

Como hemos dicho, la conducta parece dirigirse a una meta, como acercarse o 
alejarse de algo. La conducta actual está guiada por lo que el sujeto cree que será 
su consecuencia o resultado. El gato trata de salir de la caja, el carpintero golpea 
un clavo y la actriz intenta provocar una reacción emocional en sus espectadores. 

La cuestión de si la conducta debe describirse en términos de propósitos a en 
términos de movimientos, en la teoría del aprendizaje se denomina problema mo- 
lar (gran escala), en contraposición al molecular (pequeña escala). Al igual que 
muchos fenómenos complejos (por ejemplo, los arco iris, los juegos de futboD), la 
conducta de un organismo puede describirse en varios niveles distintos (como su- 
cede con una situación de estímulo correspondiente). Por ejemplo, una oración 
pronunciada por un actor en una obra de teatro puede describirse en términos de 
movimientos de la lengua, la cavidad bucal, el diafragma y las cuerdas vocales; o 
en términos de la secuencia de fonemas pronunciados, de las palabras dichas, 
de los significados o ideas comunicadas; de la destreza prosódica en la expresión o de 
la función de la línea en el desarrollo que el dramaturgo realiza en torno a un perso- 
naje o a la trama, etcétera. Un conjunto similar de capas superpuestas caracteriza 
alos posibles análisis de lo que “hace” un oyente en la audiencia. No tiene sentido pre- 
guntar; ““pero, ¿cuál de estas diversas hace en realidad?”"; evidentemente, en 
cierto sentido las está haciendo todas. Más bien, el problema es qué nivel de aná- 
Jsis resulta más provechoso para responder preguntas de interés particular, Tol- 
man se inclinó claramente por el uso de descripciones molares de la cunducta, y ba- 
cía referencia a sus supuestos propósitos. Lo que a otros psicólogos comparativos 
les resultaba perturbador en este programa era que parecía antropomórfico (que 
proyectaba rasgos humanos en los animales inferiores) y no parsimonioso (lus pro- 
pósitos inmanentes en la conducta debían derivarse de principios más simples del 
condicionamiento, en vez de tomarse como postulados básicos desde el comien- 
z0). También se asemejaba a las explicaciones teleológicas y vitalistas entunces en 
boga en la biología, algunas de las cuales eran evidentes falacias y habían sido 
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desacreditadas por completo, al punto que los biólogos de esa época automática- 
mente sospechaban de ellas. Debido a estos significados adicionales, la rama de 
Tolman del conductismo propositivo tuvo una recepción crítica de parte de los 
otros conductistas de su tiempo. 

Tolman proponía una visión de los seres humanos y de los animales que ponía el 
acento en la reflexión deliberada de) organismo acerca de los problemas, sus re- 
presentaciones internas del ambiente, la forma en que estas representaciones 
podían usarse para resolver problemas, etcétera. Estos procesos cognoscitivos 
san familiares en las intuiciones de nuestra vida mental, Por eso a los estudiantes 
les sorprende descubrir que Tolman buscaba evidencia de tales procesos cognos- 
cibivos en las satas, Jos sujetos de casi todos sus experimentos, en lugar de tratar 
de encontrarla en los seres humanos, con los cuales las explicaciones cognosci- 
tivas del aprendizaje vienen a la mente con tanta facilidad. Pero la tendencia signi- 
ficativa desde la década de 1930 hasta la de 1950 fue estudiar el aprendizaje de los 
animales inferiores, ya que el campo estaba dominado por los conductistas, que se 
manifestaban en contra de hacer atribuciones mentalistas a los animales que inves- 
tigaban. Tal vez Tolman creía que debía enfrentarse a sus adversarios ideológicos 
enel propio terreno de éstos, y que si los procesos cognoscitivos podían demos- 
trarse en los animales inferiores, el argumento en favor de la aplicabifidad de esta 
teoría a los seres humanos ganaría por abandono. 

Las obras escritas de Tolman abarcan unos 30 años; son discursivas y aneodó- 
ticas, y abundan en ideas y observaciones interesantes, En el transcurso de los 
años, sus constructos teóricos cambiaron de forma y contenido de modo que no es 
fácil resumir su teoría sistemática. Aquí se presentarán las principales ideas de los 
años más maduros de la teorización de Tolman. 


LOS CONSTRUCTOS TEÓRICOS DEL APRENDIZAJE, 
DE TOLMAN 


Expectancias y mapas cognoscitivos 


La idea básica de Tolman es que los organismos adquieren conocimientos acer- 
ca de su medio ambiente, de dónde están localizadas en él las metas importantes, 
y de la forma de ir de un lugar a otro. La unidad de conocimiento es la relación 
entre dos o más eventos de estimulo (como en el condicionamiento pavloviano), o 
entre un estímulo, una respuesta a él, y otro estímulo que sigue a la respuesta. 
Estas segundas unidades de tres términos surgen en el aprendizaje instrumental y 
cada una de ellas se denomina expectancia, Estas expectancias de tres términos, 
que se escriben dentro de un paréntesis (E,-R,-E,), se refieren al aprendizaje que hace 
el organismo de que en la situación E, dar la respuesta R, irá seguido muy pronto 
del estímulo Ez, La mejor manera de recordar el proceso consiste en pensar en al- 
guna oración como ésta '“Cuando el botón del timbre (E) se aprieta (R,), espero 
oír el zumbido del timbre de la puerta (E,)””. Esta unidad asociativa de tres térmi- 
nos, antes de que se haga algo con el timbre, es la expectancia. Si tocar el timbre 
de la puerta se convierte en una meta (Tolman diría que el E, se convierte en una 
valencia positiva). se activa la expectancia, Oprimo el botón sólo si quiero que sue- 
ne el timbre de la puerta y es posible que tenga la expectancia como una pizca (bif) 
de conocimiento aun sin hacer nada con el timbre, 
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En la teoría de Tolman, la premisa básica del aprendizaje es que el conocimiento 
se adquiere como simple resultado de la exposición y la atención del animal a los 
eventos ambientales. No es necesaria ninguna recompensa; tan sólo la contigúidad 
de los eventos experimentados. Tolman suponía que una expectancia (E,-R,-E,) 
se fortalece cada vez que los eventos objetivos E,, R,, y E, se presentan en se- 
cuencia; de modo similar, se debilita cuando E, y R, ocurren pero no van seguidos 
de E,. Este último debilitamiento, o pérdida de una expectancia específica, es la 
versión de Tolman del proceso de extinción. Durante la extinción, el animal que 
corte por el laberinto aprende a no aguardar una recompensa después de R,, sino 
más bien a esperar una caja meta vacía. Para muchos propósitos, la expectancia en 
la teoría de Tolman puede tratarse de una forma muy parecida a como tratamos el 
hábito E-R en la teoría de Hull. Por ejemplo, la expectancia es el constructo utili- 
zado para explicar Jos efectos del entrenamiento, la generalización del estímulo, la 
transferencia, la competencia de respuesta, etcétera. Un aspecto interesante es 
que una secuencia de expectancias puede ser srtegrada en una unidad mayor. Por 
ejemplo, en un laberinto T de dos unidades, una rata aprendía primero que en el 
primer punto de elección, una vuelta a la derecha conduce a los estímulos del se- 
gundo punto de elección, para Jos cuales una vuelta a la izquierda lleva a la comida. 
Con la repetición, el anima) sintetiza esta cadena de expectancias, todas las cuales 
se activan al comienzo del laberinto. Así, espera recibir comida cuando toma la 
senda correcta. 

Tolimán creía también en un proceso del pensamiento que denomina inferencia. La 
idea es ésta: si un animal ya tiene vna expectancia (£,-R,-E)). y le enseñamos otra co- 
nexión de eventos E,-E*, el animal inferirá una nueva expectancia (E,-R,-E*). La 
inferencia era el proceso mediante el cual los nuevos eventos recompensantes ea 
una caja meta (pares E,-E*) podían regresar para afectar cualquier selección sub- 
secuente de respuesta. 

Si a un animal se le permite explorar un territorio, adquirirá un elevado número 
de pizcas (bits) de E,-E, y conexiones E,-R,-E,. Tolman creía que el conocimiento 
que un animal tiene acerca de un ambiente llega a organizarse en una espe- 
cie de mapa cognoscifivo de esa área, en vez de una simple enumeración no conec- 
tada de pares locales de estimulo y respuesta. Caracterizaba esta organización del 
conocimiento de la siguiente forma: 


|El cerebro] se parece mucho más a una sala de control de mapas, que es como una an- 
tigua central telefónica. Los estímulos a los que se permite entrar no están conectados 
simplemente por interruptores, uno a uno, con las respuestas en marcha, sino que los 
impulsos entrantes por lo común se modifican y elaboran en la sala de control central en un 
mapa provisional y de tipo cognoscitivo del ambiente. Y es este mapa tentativo que indica 
rutas y sendas y relaciones ambientales, el que finalmente determina qué respuestas —si 
hay alguna— liberará a la postre el animal (1948, pág. 192). 


Tolman creía que los animales más complejos podían usar su conocimiento de la 
disposición espacial de los obietos y de las sendas para encontrar su camino hacia 
una meta deseada, de una forma muy parecida a como el lector utilizaría el mapa 
de una ciudad a fin de orientarse en ella, Si todo permanece constante, se prefiere 
la senda más corta que lleva a una meta. La idea de los mapas cognoscitivos es in- 
teresante y ha originado diversas investigaciones, que examinaremos en este mis- 
mo capítulo. 
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Aprendizaje versus ejecución 


En el sistema de Tolman las expectancias son pizcas (bits) de conocimiento que 
el organismo aprende. Pero nunca ejecutamos todas las acciones de las que somos 
capaces. De hecho, una pizca (bit) dada de conocimiento usualmente permanece 
dormida en la memoria hasta que se necesita para lograr una meta deseada. Tol- 
man fue uno de los primeros psicólogos que marcó una clara distinción entre el 
aprendizaje y la ejecución. Es posible que sepamos cómo hacer algo, pero no eje- 
cutamos ese acto hasta que no estemos apropiadamente motivados. Una persona 
puede aprender dónde hay una farmacia cerca de su nuevo departamento, pero no 
usar ese conocimiento hasta que necesite una medicina. 

Para Tolman, una expectancia (£,-R,-E,) se convierte en acción cuando la meta 
de esa expectancia (E,) adquiere una valencia fuerte y positiva. Por ejemplo, si un 
animal sediento experimenta que moverse por un laberinto le permite llegar a una 
caja meta donde hay agua, la valencia de la caja meta es mayor mientras más fre- 
alentemente el animal beba allí, y cuanto más sediento se encuentre en ese mo- 
mento. Si el animal estuviera momentáneamente saciado, la caja meta con agua no 
tendría valencia para él. Esta noción de la valencia se asemeja mucho al complejo 
motivacional impulso X incentivo usado en las teorías de Hwll y de Spence. De 
modo similar, la manera en que la valencia convierte una expectancia en una '“ten- 
dencia de reacción”, para Tolman es semejante a la forma en que la motivación 
convierte al hábito en la fuerza de respuesta (E) en la teoría de Hull. Tolman re- 
hcionaría la “tendencia de reacción** con los índices usuales de ejecución de la la- 
tencia de la respuesta, y el predominio de elección en competencia con otros cur- 
sos de acción. En estas cuestiones, no difería mucho de Hull. 

Tolman también postula un principio de reforzamiento secundario. Así, si E, es 
un estímulo con valencia, y si un E* se parea con Ez, se supone que E* adquiere 
valencia o valor, Además, en la secuencia E,-R,-E,, que da lugar a una expectancia 
correspondiente, si E, adquiriera una valencia muy alta, el estímulo anterior, E,, 
también adquiriría valencia. Esto equivale a reconocer el hecho de que los estí- 
mulos que conducen a eventos valiosos también se convierten en submetas valo- 
radas. Ásí, si insertar una ficha de póquer (E,) en una máquina tragamonedas pro- 
duce una uva (E, con valencia), para un chimpancé, el animal muy pronto valorará 
las fichas de póquer y aprenderá nuevos comportamientos para obtenerlas. Cree- 
mos pertinente hacer algunas consideraciones acerca de estas premisas básicas de 
la teoría de Tolman. Primero, hemos parafraseado un intento de MacCorquadale y 
Meeh! (1953) por precisar lo que Tolman escribía con su estilo discursivo e infor- 
mal. Segundo, algunas de las conjeturas del sistema, tal como se han descrito, son 
poco más que traducciones directas de fenómenos empíricos al vocabulario de la 
teoría de Tolman (por ejemplo, generalización del estímulo y reforzamiento secun- 
dario), Tales traducciones no deben interpretarse en el sentido de que Tolman 
“descubrió'” estos principios psicológicos, ya que se conocían mucho tiempo an- 
tes de que iniciara sus escritos sistemáticos. (La misma observación es aplicable a 
muchos de los postulados teóricos de Clark Hull, que se examinaron en el capítulo 
3.) Tercero, la enumeración de los diversos principios no hace justicia a la gran 
cantidad de experimentos y evidencia psicológica que los sustentan; en la siguien 
te sección intentaremos bosquejar todos estos aspectos. Cuarto, la enumeración 
no menciona muchas de las sugerencias informales y más programáticas disemi- 
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nadas en todas las obras de Tolman, que proporcionan un valioso estímulo para la 
investigación en áreas particulares. De nueva cuenta, en la siguiente sección sólo 
examinaremos brevemente algunas de estas hipótesis auxiliares. 


EVIDENCIA RELEVANTE DE LAS CONCEPCIONES 
DE TOLMAN * ] 


Asociaciones sensorio-sensoriales 


Una diferencia importante entre los teóricos de estímulo-respuesta y los cog- 
noscitivistas se encuentra en las unidades que pueden asociarse: los teóricos E-R 
creían que todo el aprendizaje (al menos todo aquel que podía relevarse) era desci- 
frable corno la vinculación de respuestas con estímulos, mientras que los teóricos 
cognoscitivistas como Tolman argumentaban en favor de las asociaciones directas 
entre los elementos sensoriales, unidades £-E en la memoria. Los casos de prueba 
en apariencia simples; por ejemplo, el aprendizaje de ¡as asociaciones de estí- 
mulo palabra-palabra por parte de seres humanos, se descartaron como irrele- 
vantes, en la creencia de que las personas responderían implícitamente a (o nom- 
brarían) los estímmlos, de modo que éstos se asociarían indirectamente mediante 
las respuestas. Por tales razones, se creía que la cuestión del condicionamiento 
sensorial se decidiría con mayor seguridad en experimentos con animales infe- 
riores. Así se idearon los experimentos de precondicionamiento sensorial, que se 
describen a continuación. 


Precondicionamiento sensorial 


En el precondicionamiento sensorial, dos estímulos neutrales, E, y Ez, se pa- 
rean juntos durante múltiples ensayos, y entonces uno de ellos, £,, se parea con 
un Ef biológicamente significativo hasta que E, evoca una respuesta condicionada 
(véase la figura 11.1). En la fase crítica final, se somete a prueba el estímulo E, 
para su asociación con la RC. Si ET evoca ahora la RC hasta cierto grado (en com- 
paración con los sujetos de control, para quienes los estímulas no estaban parea- 
dos en la fase 1 o en la 2), se supone que el precondicionamiento sensorial se ha 
producido. La explicación es que E, se asocia con E,, entonces E, se asocia con el 
El, y cuando E, finalmente se comprueba, E, recobra una representación de Ez, 
la cual recupera la idea del E7, que da lugar a la ocurrencia de la RC. 

Brogden (1939) realizó un experimento inicial de precondicionamiento sensorial 
con buenos resultados. Sus perros se expusieron a 200 pares simultáneos de luz y 
zumbido; después, recibían condicionamiento de flexión de una extremidad, con 


Fase 1 Fase 2 Fase3 
Figura 11.1. Tres fases en un ex- 
. perimento de precondicionamien- 
EE, Es E E-==RC tosensorial La tercera es la fase de 


a prueba, en la cual se verifica si E, 
Mec evocaa la RO 
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uno de estos indicios pareados con una descarga eléctrica aplicada a una pata. Las 
pruebas con los otros estímulos produjeron significativamente más respuestas de 
los perros experimentales que de los animales de control. Sin embargo, en el 
experimento de Brogden y en otros realizados en aquella época, el efecto del pre- 
condicionamiento sensorial fue muy pequeño y de corta duración. En consecuen- 
cía, los teóricos E-R ignoraron fácilmente el efecto de precondicionamiento sen- 
sorial, 

En experimentos subsecuentes se descubrió que los procedimientos de Brog- 
den no eran los óptimos. En particular, se produce un mejor precondicionamiento 
sensorial si el E, precede al E, por unos cuantos segundos, y si el número de pa- 
res E,-E, es relativamente pequeño antes de que se establezca la habituación. 
Con tales parámetros en la técnica de la supresión condicionada, en investigacio- 
nes recientes (Prewitt, 1967; Rizley y Rescoria, 1972) se han encontrado efectos 
«muy confiables de precondicionamiento sensorial. El efecto puede producirse si E, 
y E, se encuentran en la misma o en diferentes modalidades. Así, no hay duda de 
que en los animales las asociaciones entre estímulos neutrales y no motivacionales 
pueden formarse En ausencia de respuestas obvias a los dos estímulos, De este 
modo, se refutó una importante predicción de la teoría E-R. 


Memoria de corto plazo en los animales 


Otra línea de evidencia que sugiere el condicionamiento sensorial proviene de la 
habilidad de los animales para recordar un estímulo durante intervalos breves de 
retención. Esta habilidad de memoria de corto plazo se ha investigado más en los 
últimos tiempos. Una técnica inicial era la de reacción demorada, en la cual un ani- 
mal observa al experimentador que coloca una recompensa en una ubicación dis- 
tintiva (que varía en cada ensayo); después de un intervalo, se libera al animal, y el 
experimentador observa si escoge de inmediato la ubicación correcta, Si la prueba 
biene, éxito, se supone que el animal retuvo alguna representación del evento du- 
rante el intervalo de retención. Sin embargo, el procedimiento de reacción demo- 
tada últimamente, ha caído en desuso en tanto no asegura que el animal atienda 
cuidadosamente al ““cebo”* de ubicación de la recompensa, ni descarta con faci- 
tidad la posibilidad de que él mismo recuerde dicha ubicación al mantener simple- 
mente una *'postura de señalamiento”, como lo hace un perro de presa al señalar 
aun pájaro en el campo. 

Por tales razones, el procedimiento preferido es la igualación demorada a la 
muestra, cuyos pasos dentro de cada ensayo se ilustran en la figura 11.2. En la 
parte frontal de la jaula de una paloma o de un mono se montan tres cuadros sobre 
los cuales se proyectan desde atrás formas de estímulo. Mediante el entrenamien- 
lo gradual, se prepara al animal para que responda (picotee o empuje) cualquier 
cuadro iluminado con una forma. Entonces se le enseña a picotear en el cuadro de 
muestra central (cuando está iluminado), a fin de iniciar la presentación de los 
cuadros de elección al lado. Se recompensan las respuestas al cuadro de elección cuya 
forma se iguale a Ja de muestra en este ensayo, mientras que los errores a la for- 
ma equivocada no se refuerzan, mediante el retorno a la situación entre-ensayos. 
El estímulo de muestra (triángulo o cuadrado en la figura 11.2) se alterna aleato- 
riamente en el transcurso de los ensayos, lo cual se hace también con la ubicación 
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del cuadro de elección correcta. Así, el animal debe recordar en verdad el estí- 
mulo de muestra en un ensayo dado, y escoger al compañero que concuerde. El 
entrenamiento inicial en la igualación se hace sin ninguna demora y sólo con dos 
estímulos, pero a medida que se adquiere la habilidad pueden introducirse más es- 
tímulos y aumentar las demoras. 

En la figura 11.3 se muestran algunos datos típicos de memoria de corto plazo 
en un experimento con palomas que dirigió Roberts (1972). En diferentes bloques 
de ensayo, las palomas tenían que picotear el cuadro de muestra 1, 5 0 15 veces 
antes de que la muestra se retirara con lo cual se iniciaba una demora de 0, 1, 306 
segundos previa a la elección. Evidentemente, los animales olvidan durante el 
breve intervalo, Asimismo, sus niveles iniciales de ejecución mejoran con más re- 
peticiones del estímulo de muestra, pero esto no afecta las tasas de olvido, como 
puede observarse por la declinación paralela en las curvas. 


Entre ensayos 


a Llave de 
a 9 muestra 


3 Intervelo 
1 o de demora 


0 Llaves de 
E O 


Figura 11.2. Secuencia de estímu- 
los en tres llaves de respuesta 


dentro de cada ensayo de un ex- 

en perimento de igualación demora- 
'orno 

Bin Bnsayos' daa la muestra Los eventos ocu- 

rren en un ciclo de arriba hacia 


abajo 
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Figura 11.3. Porcentaje correcto 
de igualaciones a la muestra en 
demoras de O a 6 segundos, en 
palomas que picoteaban la llave 
de muestra 1, 5 0 15 veces antes 
del intervalo de retención (toma- E 3 

da de Roberts, 1972) Demora (seg) 


Porcentaje de respuestas correctas 


A efectos de comparar la función de olvida MCP de las palomas, en la figura 
11.4 se muestra una función MCP similar para seres humanos obtenida por 
Hellyer (1962). Estos sujetos leían un trigrama sin sentido (como C/M) presen- 
tado 1, 2, 4 u 8 veces en rápida sucesión antes de que contaran hacia atrás desde 3 
a27 segundos, y entonces intentaran recordar. Con el mimero de repeticiones, la 
memoria verbal mejoraba de una manera muy parecida a como lo hacía la memoria 
de las palomas para el estímulo de muestra con el número de veces que lo picotea- 
ban antes de que se eliminara en un ensayo. La correspondencia de los conjuntos 
de curvas es notable. 

La cuestión teórica es cómo retiene el animal una representación del estímulo 
de muestra durante el intervalo de demora para instigar su elección posterior del 
estímulo de igualación. Hay dos explicaciones E-R posibles. La primera afirma 
que el animal aprende un conjunto de cadenas de comportamientos “'adjuntivos”” 
(por ejemplo, ir al costado derecho o izquierdo de la jaula durante el intervalo de 
demora), cada una de las cuales es activada por un estímulo específico, de muestra 
y que tales cadenas transportan el recuerdo del estímulo de muestra durante el in- 
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Intervalo entre el recuerdo (seg.) ción (tomada de Hellyer, 1962), 
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tervalo de retención. Esta concepción explica por qué la igualación demorada es 
una habilidad que se adquiere con lentitud y requiere de mucha práctica. Pero no 
logra explicar nada más, Por ejemplo, los monos pueden aprender a hacer igua- 
lación demorada con 25 o más estímulos diferentes, y no es admisible conjeturar 
tantas cadenas de respuesta convenientemente dispuestas. Asimismo, se desen 
peñarán de forma adecuada en los ensayos de prueba con nuevos estímulos de 
muestra. Además, las búsquedas de las cadenas mediadoras de respuesta 
(D'Amato, 1973) no han dado resultados. En su mayor parte, los animales pare- 
cen recordar sin “exteriorizar”” ese recuerdo en su musculatura periférica durante 
todo el intervalo de retención. 

Una explicación E-R alternativa postula que el picotear el estímulo de muestra 
establece y fortalece una tendencia E-R temporal (por ejemplo, **picotear triángu- 
lo”", en la figura 11.2), que está disponible y se activa en la prueba de elección, 
Como en el transcurso de los ensayos los hábitos de *“picotear triángulo*” y **pico- 
tear cuadrado”” se reforzarían aproximadamente con la misma frecuencia, el forta- 
lecimiento del hábito de muestra correcto dentro de un ensayo dado tendría que 
vencer cualquier desventaja (por ejemplo, un hábito incorrecto más poderoso) 
creada por los pasados ensayos. Por lo tanto, la necesidad de más picoteos al cua- 
dro de muestra —como lo hizo Roberts en su experimento— debe fortalecer el há- 
bito para la respuesta correcta en ese ensayo de elección (lo cual es el resultado 
rea] que aparece en la figura 11.3). 

Un problema crítico con esta segunda explicación E-R es que los animales tam- 
bién aprenden fácilmente tareas de igualación condicional y de igualación transmo- 
dal casi tan bien como la tarea de igualación simple que se describe en la figura 
11.2. En estas tareas, un estímulo de muestra informa al animal de que algún se- 
gundo estímulo asociado es correcto en ese ensayo de elección. Así, una luz de 
muestra roja podría señalar que el triángulo será reforzado en ese ensayo, mien- 
tras que una luz de muestra verde indica que el cuadrado será reforzado en ese 
ensayo de elección o un sonido alto a bajo podría señalar que el triángulo o el cua- 
drado se reforzarán en ese ensayo de elección. D'Amato y Worsham (1972) des- 
cubrieron que la ejecución de los monos era tan exacta en la igualación condicional 
como en la igualación demorada estándar a la muestra. 

Estos resultados no pueden explicarse en términos de condicionar una respues» 
ta de acercamiento al estímulo de muestra dentro de un ensayo dado; se explican 
de modo más simple en términos de asociaciones sensoriales. Dentro de cada en- 
sayo, el animal debe establecer una asociación temporal, *“muestra actual + triángu- 
lo”, y activar este recuerdo para guiar su elección. Si se trata de una tarea de 
igualación condicional, la elección depende de nuevas reglas de equivalencia adqui- 
ridas y almacenadas en la memoria permanente; es decir, reglas de forma. **Si la 
muestra actual = roja, entonces escoger triángulo”. Con este análisis la tarea puede 
ser difícil, porque en el momento de la prueba el sujeto tiene interferencia asocia- 
tiva entre diferentes recuerdos “muestra actual > X'”. Básicamente, debe discri- 
minar la muestra más reciente de las anteriores. Como la discriminación en el 
transcurso del tiempo sigue la ley de Weber, con una diferencia dada que es me- 
nos discriminable cuanto más largo sea el intervalo base, los errores causados por 
confusiones entre la muestra de este ensayo y las muestras de los ensayos ante- 
riores, se incrementarán con intervalos de retención intraensayo más prolonga- 
dos. Por supuesto, esto es la función estándar de olvido en la igualación demora- 
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da. Asimismo, las confusiones de las muestras de este ensayo y de los anteriores 
aumentan cuanto más próximos en el tiempo se encuentren los ensayos sucesi- 
vos, Por lo tanto, esta teoría de la discriminación de etiquetas temporales sobre 
asociaciones sensoriales parece proporcionar una explicación clara de muchos he- 
chos relevantes en la igualación demorada a la muestra (para detalles, véase 
D'Amato, 1973). Al parecer muchos otros resultados acerca de la memoria de 
corto plazo en animales se explican de modo similar. Sin embargo, desde nuestra 
perspectiva actual, estas asuciaciones sensoriales infringen la teoría E-R. 


El aprendizaje de meta como opción 
al aprendizaje de respuesta 


Las teorías de estímulo-respuesta implican que el organismo, incitado a lo largo 
de un camino por estímulos internos y externos, aprende la secuencia de movi- 
mientos correctos que puede provocarse en condiciones apropiadas de impulso y 
estimulación ambiental. De acuerdo con la teoría tradicional E-R, en el momento 
de la selección de la respuesta el organismo no tiene ninguna representación de la 
meta; todo lo que ““sabe'”, según una interpretación estrictamente watsoniana, es 
que ciertas respuestas disponen de fuerzas particulares en determinadas situacio- 
nes. Las condiciones de reforzamiento no están representadas en el conocimiento 
que el sujeto posee acerca de la situación: más bien se reflejan en las fuerzas rela- 
tivas de conexiones E-R particulares. 

La posibilidad que Tolman propone es que los organismos aprenden metas (''re- 
compensas””) de modo que llegan a conocer qué estímulos seguirán a combina- 
ciones E-R particulares. Así, la formulación E-R-E de Tolman atribuye al sujeto 
una representación interna de la meta o del siguiente estímulo en la secuencia. 
Durante el aprendizaje de una secuencia de respuesta, como la de recorrer un la- 
berinto complicado, el aprendiz sigue signos que conducen a la meta, aprende el 
camino trazando un cierto tipo de mapa; en otras palabras, no aprende movimien- 
tos sino rutas para llegar al objetivo. Muchas situaciones de aprendizaje ho permi- 
ten distinguir claramente entre estas dos posibilidades. Si existe una sola senda a 
cuyo término hay comida, y el organismo corre hacia ella más rápidamente en cada 
oportunidad, no hay manera de saber si las respuestas se graban en su memoria 
por el reforzamiento, o si lo guía su valencia de meta cada vez más fuerte y su ex- 
pectación de alimento. 

Como el aprendizaje de estímulo-respuesta y el de expectancia anticipan muy a 
menudo Ja misma consecuencia conductual, es necesario diseñar experimentos 
especiales en los cuales sea posible favorecer más a una teoría que a la otra, Tres 
situaciones proporcionan fuerte apoyo a la opción de la expectancia, Se trata de 
experimentos acerca de la expectancia de recompensa, el aprendizaje de lugar y el 
aprendizaje latente. 


Expectancia de recompensa 

Una de las primeras y más sorprendentes observaciones acerca de la expectan- 
dia de recompensa fue la de Tinklepaugh (1928). En su experimento colocaba comida 
debajo de uno de dos recipientes mientras un mono observaba, pero no podía tener 
acceso inmediato a los recipientes y al alimento. Unos cuantos segundos después, 
se le permitía al animal elegir entre los recipientes y éste invariablemente demos- 
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traba su memoria al hacer la elección correcta. Ésta es la situación estándar de 
respuesta demorada. La conducta de interés ocurría después de que se había ocul- 
tado un plátano debajo de uno de los recipientes, cuando el experimentador, que 
estaba fuera del campo de visión del simio, lo cambiaba por una hoja de lechuga (un 
alimento menos apreciado). Al dar vuelta el recipiente correcto y encontrar la hoja 
de lechuga en vez de la fruta apetecida, los monos mostrarían ''sorpresa'”” y frus- 
tración, rechazarían la lechuga y se dedicarían a un comportamiento definitivo de 
búsqueda, como si trataran de encontrar el plátano ansiado. En un experimento 
con ratas en laberinto, Elliott (1928) encontró un tipo de comportamiento muy si- 
milar cuando la comida de una caja meta, que consistía en una masa de salvado, se 
cambiaba por semillas de girasol. Posteriormente se realizaron experimentos más 
sistemáticos con chimpancés (Cowles y Nissen, 1937). Hay pocas dudas de que 
los animales tienen algún tipo de expectación por objetos meta específicos. En 
esas circunstancias, otros objetos meta producen signos de desequilibrio de la 
conducta, lo cual significa que la teoría del aprendizaje de signos es apropiada. Sin 
embargo, esto no quiere decir que otras teorías no traten de deducir la conducta a 
partir de otros principios. Como se dijo en el capítulo 5, la teoría de Hull intentaba 
representar la expectancia de recompensa en términos de la respuesta meta antici- 
patoria fraccionaria (»¿), El experimento dirigido por Trapold (1972), que hemos 
examinado en el capítulo 5 es sólo un ejemplo reciente de los efectos debidos a la 
anticipación de diferentes recompensas. Además, Amsel (1958, 1962), un neo- 
hulliano, plantea su hipótesis acerca de la frestración al considerarla como resul. 
tado de la discrepancia entre una recompensa esperada y una obtenida. de modo 
que los hullianos más recientes básicamente aceptaron la noción de Totrnan de que 
en el momento de responder, el organismo tiene alguna representación de la re- 
compensa esperada. 


Aprendizaje de lugar 

Los experimentos acerca del aprendizaje de lugar se diseñaron para demostrar 
que en el laberinto el aprendiz no se mueve desde el comienzo hacia la meta de 
acuerdo con una secuencia fija de movimientos musculares o de cambio, como la 
prediría la idea de que las respuestas deben definirse de acuerdo con la muscu- 
htura exacta que interviene. Tolman creía más bien que el animal es capaz de 
mostrar un comportamiento que varía apropiadamente, según las orientaciones al- 
teradas de sí mismo o del laberinto en relación con el medio ambiente; es como si 
el animal supiera dónde se encuentra la meta. Por ejemplo, un mono recompensa- 
do por escoger un triángulo negro en lugar de un cuadrado blanco cuando éstos se 
presentan alternativamente a la izquierda o a la derecha en una hilera horizontal, 
continuará eligiendo el triángulo negro si los objetos se presentan en una dispo- 
sición vertical, uno encima del otro. El organismo ha aprendido a “acercarse al 
triángulo negro'* en vez de “escoger correctamente la configuración de blanco a 
la izquierda, negro a la derecha”. 

Varios subtipos de experimentos revelan ese aprendizaje de lugar o de meta. El 
primer subtipo de aprendizaje de lugar deja intacta la forma del curso, pero inter- 
fiere con las secuencias de movimiento desde el punto de partida hasta la meta. En 
un experimento, las ratas que habían aprendido a recorrer un laberinto eran lesio- 
nadas en el cerebelo; aunque incapaces de moverse, a no ser con movimientos pe- 
queños y circulares, lograban encontrar su camino sin cometer errores (Lashley y 
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Ball, 1929). En este caso, es claro que no pudieron haber repetido secuencias de 
hábitos kinestésicos aprendidos con anterioridad. En otro estudio, las ratas fueron 
capaces de demostrar lo que habían aprendido, al recorrer la senda correcta des- 
pués de haber sido entrenadas a cruzar el laberinto nadando (MacFarlane, 1930), 
Más adelante se demostró que las ratas que en muchas ocasiones habían sido 
arrastradas en una pequeña balsa por un laberinto lleno de agua, y que observaban 
repetidas veces la secuencia correcta de vueltas en puntos de elección señalados 
para llegar a una meta recompensada con alimento, después eran capaces de reco- 
rrer el laberinto casi sin errores cuando se les daba la oportunidad de ejecutar su 
respuesta. Aparentemente, habían aprendido la secuencia correcta de signos o in- * 
dicios que conducían a la caja meta recompensante. Todo esto se lograba sin mo- 
vimientos manifiestos de correr, 

El segundo subtipo de experimento de aprendizaje de lugar establece un hábito 
de movimiento en comparación con un hábito espacial, y determina cuál de los dos 
se aprende más fácilmente, Tolman y sus colaboradores (Tolman et al., 1946, 
1947) dispusieron un laberinto elevado en forma de cruz, como se muestra en la fi- 
gura 11.5. El grupo de aprendizaje de respuesta se iniciaba en alternancia aleatoria 
a partir de E, o de E,, y siempre encontraba comida al dar vuelta a la derecha; es 
decir, el alimento se localizaba en F, cuando el punto de partida era E,, y en F, 
cuando el punto de partida era Ez. Por el contrario, el grupo de aprendizaje de 
lugar siempre iba al mismo sitio para obtener alimento. Esto significa que si para 
correr a F, se requería de una vuelta a la derecha cuando se comenzara a partir de 
E,, se necesitaría una vuelta a la izquierda cuando se empezara de E. En este ex- 
perimento, el grupo de aprendizaje de lugar era el más exitoso. Las 8 ratas de 
este grupo aprendieron en 8 ensayos, mientras que ninguna de las del grupo de 


Ez 
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Figura 11.5, Laberinto usado para probar la facilidad relativa de aprender una res- 
puesta que trae consigo una recompensa, o bien el lugar donde se encuentra tal re- 
compensa. Al comenzar de modo irregular en E, y E), pero al encontrar recompensa 
siempre ert la misma caja de comida, un grupo de ratas se vuelve hacia la derecha, 
después hacia la izquierda, para hallar comida siempre en el mismo lugar. Éstas son 
las que están aprendiendo el Jugar. Al comenzar ya sea en E, o en £,, pero siempre en- 
contrando comida como resultado de dar vuelta en la misma dirección (izquierda o 
derecha), se enseña a otro grupo a emitir la misma respuesta, pero a encontrar la co- 
mida en diferentes lugares, según el punto en donde comiencen. El aprendizaje de lu- 
gar, en las condiciones del experimento, es más fácil que el aprendizaje de respuesta 
(tomada de Tolman et a!., 1946). 
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aptendizaje de respuesta aprendió con tanta rapidez, y 5 de ellas no alcanzaron el 
criterio en 72 ensayos. En estas circunstancias (un laberinto elevado con muchos 
indicios extra) se demostró con claridad que el aprendizaje de lugar es más simple 
que el de respuesta. 

Sin embargo, otros experimentos arrojaron resultados conflictivos (por ejern- 
plo, Blodgett y McCutchan, 1947, 1948), y se descubrió que el aprendizaje 
de respuesta a veces es más rápido, otras más lento, y en ocasiones igual al 
aprendizaje de lugar, dependiendo de la presencia y distintividad de los indicios ex- 
tralaberínticos relativos a los indicios de posición izquierda-derecha. Restle (1957) 
ofrece una posible solución para esos contradictorios informes al sugerir que los 
sujetos pueden aprender a responder en lo que respecta a cualquier tipo de indicio 
(de lugar o de respuesta), y que las tasas relativas de aprendizaje dependen de la 
prominencia o del carácter distintivo relativo de los dos tipos de indicios en la si- 
tuación total del laberinto. Por ejemplo, podemos reducir el carácter distintivo de 
los indicios de lugar (por ejemplo, al hacer que los brazos del laberinto formen una 
Y con ángulos progresivamente menores de 180 grados). Estos arreglos tienen el 
efecto deseado al desacelerar la adquisición en los sujetos que deben aprender en 
lo que concierne al indicio manipulado. Restle hizo progresar el análisis mediante 
ún modelo matemático del aprendizaje de discriminación, que permitía la evalua- 
ción cuantitativa de la prominencia” o el “carácter distintivo” de los indicios de 
lugar y/o de respuesta. Así, se confirmó la predicción de que cuando los sujetos 
aprendían un problema en el cual el lugar y las respuesta siempre se correlacionan 
y son redundantes (por ejemplo, en la figura 11.5, el sujeto siempre comienza a 
partir de E, y siempre encuentra comida en F), sus tasas de aprendizaje serán la 
suma de las tasas de aprendizaje de los sujetos que sólo aprenden por lugar y de 
los que aprenden únicamente por respuesta. Es decir, las tasas de aprendizaje son 
más altas para los problemas con indicios relevantes redundantes. Además, Res- 
tle descubrió que en una prueba conflictiva que se aplicaba después del aprendizaje 
“bgar + respuesta'”, cuando las dos modalidades de respuesta se colocan en 
oposición, el porcentaje de los animales que escogen la opción de lugar en los en- 
sayos de prueba es predecible a partir de las estimaciones anteriores de las pri- 
macías relativas de los indicios de lugar y de respuesta donde el indicio sobresa- 
liente recibía las elecciones predominantes. En suma, el análisis de Restle parecía 
haber resuelto satisfactoriamente la controversia entre el lugar y la respuesta, y 
demostró los aspectos en los cuales ésta era errónea o, al menos, que se basaba 
en un análisis demasiado simple de lo que se aprende o puede aprenderse. 

El tercer subtipo de experimento de aprendizaje de lugar implica el uso de sen- 
das alternativas cuando una senda practicada está bloqueada. Una forma primitiva 
del experimento de senda bloqueada es la de Tolman y Honzik (19304), que su- 
puestamente demuestra la expectación inferencial, o discernimiento, en las ratas. 
Las principales características del arreglo son las siguientes. Hay tres sendas (1, 2 
y 3), en ese orden de longuitud, desde la más corta hasta la más larga y, por lo tan- 
to, en ese orden eventual de preferencia (figura 11.6). En el entrenamiento preli- 
minar, cuando la senda 1 estaba bloqueada en A, se establecía una preferencia en- 
tre las sendas 2 y 3 para la más corta de ambas. Sólo cuando la senda 2 también 
estaba bloqueada, las ratas corrían por la senda 3. En el entrenamiento preliminar 
se estableció una familiaridad con todas las sendas y una preferencia por éstas en 
el orden de 1, 2, 3. Una característica importante del diseño del laberinto, crucial 


Cap. 11. El aprendizaje de signos, de Tolman 421 


para la prueba, era que las sendas 1 y 2 tenían un segmento común que llevaba a la 
meta. Anteriormente, el obstáculo en la senda 1 se había colocado en el punto Á, an 
tes de este alargamiento de la senda común; entonces, después de encontrarse 
con el obstáculo y regresar, la rata corría por la senda 2. En el ensayo crítico de 
prueba, el obstáculo se colocaba más arriba, a lo largo de la senda 1, de modo que 
caía en la senda común, en el punto B. La cuestión era si la rata, al regresar, esco- 
gería la segunda opción, la senda 2, y quedaría frustrada o “'inferiría'* que tal sen- 
da también estaba bloqueada. Lo que las ratas hacían principalmente era evitar la 
senda 2, y tomar la que por lo común preferían menos, la senda larga 3, la única 
abierta, en razón del obstáculo en el puto B. De este modo, surge nueva eviden- 
cía para la hipótesis de que la rata actúa de acuerdo con un “'mapa'” de la situación, 
y no según el hábito ciego, o con la ejecución automática en el orden jerárquico de 
hábitos provocados por los estímulos del punto de elección. 

Otros investigadores criticaron el experimento de Tolman y Honzik, y dernos- 
traron que los resultados, aunque podían repetirse, se desequilibraban con facili- 
dad mediante la manipulación de las variables experimentales como la anchura o el 
bloqueo de los pasadizos, que en teoría no deben afectar a la 'habilidad de razona- 
miento” del animal; para detalles véanse Evans (1936), Harsh (1937), Keller y 
Hil (1936), y Kuo (1937), Se informó de una repetición exitosa en un laberinto de 
Caldwell y Jones (1954), y en una ingeniosa variación que introdujeron Deutsch y 
Clarkson (1959), cuyos resultados verificaron lo anterior. Los posteriores expe- 
rímentos con primates superiores han demostrado repetidas veces esas inferen 
clas de discernimiento (Menzel, 1978). 


Aprendizaje latente 
Además de los experimentos acerca de la expectancia de recompensa y el 
aprendizaje del espacio, hay una tercera variedad que trata fundamentalmente 
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el aprendizaje de signos: los experimentos acerca del aprendizaje latente. Éstos de- 
muestran que un animal puede aprender sencillamente al explorar un laberinto, sin 
recompensas alimenticias, de modo que cuando más tarde se introduce la recom- 
pensa, la ejecución es mejor que la de las ratas sin esta exposición, y a veces es 
tan buena como la de los animales que previamente han tenido múltiples ensayos 
recompensados, El ''aprendizaje latente” consiste en el conocimiento del la- 
berinto, que no se revela en la elección de la senda más corta desde la entrada a la 
salida sino hasta que la rata está motivada para escoger. Los experimentos, que 
se iniciaron con los de Blodgett (1929), criticaban la hipótesis de que el reforza- 
miento era necesario para que tuviese lugar algún aprendizaje asociativo. Thorn- 
dike, Pavlov y Hull han apoyado esta difundida hipótesis. 

Con base en el trabajo iniciado por Blodgett (1929), Tolman y Honzik (19306) 
estudiaron el efecto de la introducción de la recompensa en un experimento con la- 
berinto para ratas, después de que éstas lo habían recorrido durante 10 ensayos 
sin comida. El grupo de control, que se alimentaba diariamente en el laberinto, re- 
dujo sus puntuaciones de error y de tiempo con mayor rapidez que el grupo no ali- 
mentado. Pero cuando se le daba comida al segundo grupo, su ejecución era tan 
buena como la del grupo siempre recompensado. Así, parecía que el grupo no ali- 
mentado se había beneficiado tanto con sus ensayos previos como el grupo alimen- 
tado. Como este aprovechamiento no se manifiesta en la ejecución anterior, se 
dice que el aprendizaje que ocurre es latente. En la figura 11.7 pueden observarse 
los resultados de la eliminación del error. Había tres grupos: dos de control, uno 
recompensado durante todo el tiempo, el otro no recompensado, y el grupo expe- 
rimenta) no recompensado hasta el undécimo ensayo. En el duodécimo día, el gru- 
po experimental, que se había alimentado sólo una vez en el laberinto, cometía tan 
pocos errores como el grupo que los días anteriores había recibido alimento en él. 

Este experimento, merece algunos comentarios. El laberinto usado era del tipo 
T múltiple de 14 unidades (Stone y Nyswander, 1927), con puertas entre cada uni- 
dad para evitar la retirada, Incluso sia conida al fmal, la rata todavía avanzaba por 
el laberinto (a puerta de error estaba cerrada); según una teoría de la última res- 
puesta, como la de Guthrie, las condiciones de aprendizaje eran ideales. La rata no 
tenía ninguna oportunidad de desaprender lo que había hecho a último momento en 
cada segmento, que era, por supuesto, atravesar la puerta correcta para pasar a la 
siguiente. Los resultados constituyen una crítica a la teoría de Guthrie no porque 
ha rata muestre aprendizaje latente, sino porque no revela el suficiente aprendizaje 
cuando no hay comida al final del laberinto. La explicación de Guthrie no basta, ya 
que las ratas alimentadas aprendían mucho mejor que las no alimentadas en los pri- 
meros ensayos, 

En su forma antigua, las teorías del reforzamiento tampoco podían explicar el 
aprendizaje latente. En las teorías de la ley del efecto, la premisa era que el refor- 
zamiento trabaja directamente sobre la fuerza de la respuesta, de modo que todo 
lo que se aprende debe revelarse en la ejecución. Pero al parecer, los casos del 
aprendizaje latente desmentían este supuesto; como Tolman había previsto, algún 
aprendizaje (es decir, el conocimiento del laberinto) podría producirse y estar dis- 
ponible sin que se usara, hasta que las condiciones motivacionales o de recompen- 
sa lo hicieran conveniente. 

En su defensa contra los experimentos del aprendizaje latente, los teóricos del 
reforzamiento por lo común se aprovecharon de la disminución de errores durante 
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figura 11.7. Evidencia del aprendizaje latente en el laberinto. $in recompensa de co- 
mida hay alguna reducción en los errores, pero no tan grande como cuando existe la 
recompensa. A pesar de las puntuaciones de error más elevadas que se produjeron 
antes de que se presentara la comida, el grupo recompensado sólo a partir del undé- 
cimo ensayo comienza a comportarse tan bien como el grupo que había sido recom- 
pensado con regularidad. $e concluye que tuvo lugar algún aprendizaje, durante los 
diez primeros ensayos, el cual no se mostró en la ejecución sino hasta ser activado 
por el incentivo de la comida (tomada de Tolman y Honzik, 19305). 


los ensayos no recompensados en Jos experimentos de aprendizaje latente (obsér- 
vense en la figura 11.7 las curvas declinantes de error para los 10 primeros días). 
Este decremento se tomó como prueba de la presencia de algún reforzamiento 
antes de la introducción de la recompensa. Por ejemplo, como una elección erró- 
nea en el laberinto daba lugar a que la rata se golpeara el hocico contra una puerta 
cerrada, tal vez las respuestas correctas se volvían relativamente más fuertes por 
la sencilla razón de que los errores recibían un leve castigo. Pero en realidad, tales 
argumentos sólo podtían explicar ese copioso avance en virtud del reforzamiento; 
cualquier avance que previamente estuviera oculto y que se manifestara al intro- 
ducir la recompensa permanecía sin explicación. No obstante, como vimos en el 
capítulo 5, en la última teoría de Hull la fuerza del hábito (5ATp) se adquiere inde- 
pendientemente de la magnitud del reforzamiento, de manera que esta dificultad 
ha desaparecido. Con valores mínimos de magnitud de incentivo, K, la fuerza del 
hábito es “latente””, y sólo se revela en el potencial de reacción cuando se crea la 
motivación de incentivo al introducir la recompensa alimenticia. Entre los ejem- 
plos de incentivos mínimos que pueden estar presentes sin recompensa alimen- 
tica, por ejemplo, se cuenta la exploración, el retorno a la jaula hogar, etcétera. 
Pero este cambio en la teoría de Hull se realizó en parte para manejar los resul- 
tados del aprendizaje latente. 

La explicación de Tolman es que la situación no recompensada es eficaz para el 
aprendizaje de las relaciones espaciales del laberinto. Cada unidad tenía un extre- 
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mo cerrado y otro con una puerta. En cada caso, lo último que se hacía era a tra- 
vesar la puerta. Lo reciente (que se acepta como favorable al desarrollo de la ex- 
pectancia) fortalecería el cunocimiento de que la puerta constituía el camino de un 
segmento hacia el siguiente; en condiciones no recompensadas, la rata no tenía ra: 
zón para demostrar lo que '“sabía””. La sustitución del alimento al final del labe- 
rinto, un objeto meta sumamente deseado, llevaba al animal a emplear su mapa 
cognoscitivo, a dar las vueltas que conducían de una unidad a la siguiente. De allí la 
reducción repentina en los errores. Aunque durante algún tiempo el aprendizaje 
latente fue motivo de discusión, y muchos de los resultados con ratas en labe- 
rintos eran inconsistentes, el resultado neto es que el aprendizaje latente consti- 
tuía un fenómeno real. Puede demostrarse fácilmente con los primates superio- 
res, como veremos más adelante (Menzel, 1978). 


Alteración directa de la valencia meta 


Tolman creía que los animales podían combinar varias pizcas (bits) de conoci- 
miento para inferir lo que deberían hacer en una situación de elección, Al conocer 
el camino hacia una ubicación distintiva en el laberinto y aprender entonces que alí 
hay comida, en la entrada del laberinto el animal infiere que si se dirige a ella en- 
contrará alimento, Los experimentos de aprendizaje latente antes examinados son 
pertinentes para este proceso de inferencia, como sucede con los experimentos 
en los cuales, después del aprendizaje, el incentivo al final del laberinto se cambia 
radicalmente. 

Se han realizado varias pruebas de este tipo. Un experimento clásico es el de 
Tolman y Gleitman (1949) quienes primero familiarizaron a las ratas con un labe- 
finto en forma de T que tenía recompensas alimenticias en las dos cajas meta dis- 
tintivas, lo cual hacía que el atractivo de los dos brazos del laberinto fuera el mis- 
mo. Entonces, un día determinado, los animales fueron colocados directamente en 
una de las cajas meta y se les aplicaron descargas eléctricas dolorasas. En las 
pruebas cruciales de elección libre que siguieron, los animales escogían predo- 
ininantemente el brazo del laberinto que conducía a la otra caja meta, y evitaban el 
que Jevaba a la caja de descarga. Como los indicios diferenciales para la caja meta 
no eran perceptibles desde el punto de elección del laberinto (estaban ocultos por 
cortinas), el animal, al escoger, debe haber ““recordado** que uno de los brazos 
del laberinto llevaban al lugar donde había recibido una descarga, y por eso evitaba 
esa senda y elegía la otra. 

Un segundo tipo de experimento es el que se denomina extinción latente. El pri- 
mero de ellos lo dirigieron Seward y Levy (1949), y la bibliografía acerca del tema 
fue reseñada por Moltz (1957). En estos experimentos primero se entrenaba a los 
animales en una respuesta instrumental simple; por ejemplo, presionar una palan- 
ca a fin de poner en marcha un mecanismo que suministraba comida o correr por 
un pasadizo para recibir alimento en la caja meta, Después de que la ejecución está 
bien establecida, se expone directamente al sujeto a la situación meta sin recom- 
pensa; la palanca podría sacarse de la jaula y el experimentador operaría el meca- 
nismo distribuidor de comida varias veces sin entregar alimento alguno, o se po- 
dría colocar al animal directamente en la caja meta del pasadizo en repetidas uca- 
siones y sin comida. Tales experiencias inevitablemente originan la extinción de la 
última parte de la cadena conductual establecida con anterioridad: el anirnal deja de 


Cap. 11. El aprendizaje de signos. de Tolman 425 


acudir al comedero cuando el surtidor hace ruido, Pero las observaciones críticas 
tienen lugar cuando se vuelve a ubicar al animal en la primera parte del pasadizo, o 
cuando la palanca de respuesta se reinstala en la jaula, Invariablemente, la res- 
puesta inicial ya se ha debilitado muchísimo, y con frecuencia no se produce. La 
rata en la caja de partida ya no está tan dispuesta a correr hacia la caja meta, pues- 
to que “infiere** que en ella no encontrará comida; o en el tipo de experimento 
con la palanca, el animal no está muy dispuesto a presionarla para paner en marcha 
el mecanismo surtidor, pues infiere que el sonido del mecanismo ya no está aso- 
ciado con el alimento (el objeto que originalmente tenía valencia). 

Éstos son resultados del sentido común; su característica peculiar es que impli- 
quen que la fuerza de una secuencia instrumental puede alterarse sin que esa res- 
puesta ocurra y reciba las condiciones alteradas de reforzamiento, La rata no pre- 
sionaba la palanca, hacía que el surtidor se pusiera en marcha y no recibía comida. 
Sólo estaba roto el último eslabón de la cadena; sin embargo, la influencia de ese 
evento se transmitía a los miembros anteriores de la secuencia conductual, Estos 
resultados representan una dificultad para la teoría E-R del reforzamiento, la cual 
supone que las fuerzas del hábito de las respuestas sólo pueden alterarse cuando 
ocurren y son entonces explícitamente castigadas o no recompensadas. Al pare- 
cer, los resultados indican dos premúsas: que al comienzo de una secuencia con- 
ductual, los organismos disponen de alguna representación de la meta que esperan 
conseguir al fina) de la secuencia de respuesta; y que esa expectación de meta 
puede ser alterada mediante la experiencia directa con la situación meta, Sin la eje- 
cución de la secuencia de respuesta previa que conduce a ella. Éstas son exacta- 
mente las premisas de la teoría de Tolman. Resultados como éstos fueron los que 
que obligaron a Hull y a Spence a confiar más en la 7¿, la respuesta meta anticipa- 
toria, como representación teórica de la expectancia de meta del organismo, 


El reforzamiento y la confirmación 
de la expectancia 


Tolmán se oponía a la ley del efecto; creía que el aprendizaje acerca de la corre- 
kción entre sucesos se producía como resultado de experimentarlos juntos, y que 
las recompensas o los castigos coincidentes no eran necesarios, Admitió que la 
motivación y la recompensa podrían tener un efecto indirecto sobre lo que se 
aprende, en virtud de que en parte determinan qué estímulos atraen la atención del 
sujeto o son destacados. Así, una rata hambrienta es propensa a atender los estí- 
mulos cercanos al lugar donde se le alimenta, y por ello aprende más acerca de esa 
ubicación que de cualquier otra donde no se le alimente. 

Este énfasis o función informativa de la recompensa también es evidente en es- 
tudios del aprendizaje verbal humano (por ejemplo, Atkinson y Wickens, 1971). 
Los sujetos ensayan de modo preferencial los reactivos verbales que se les ha di- 
Cho que vale la pena recordar, y esto aumenta su memoria a expensas de los reac- 
tivos menos valiosos. En tales casos, la “'recompensa” actúa como una señal m- 
formativa y ayuda al sujeto a seleccionar eventos particulares a los que atenderá, y 
alos cuales repetirá y aprenderá. 

Si se presenta una expectativa dada, y la meta o la consecuencia es la esperada, 
se dice que la expectancia se confirma y por eso se ha incrementado hacía el 
100%; si se presenta una consecuencia inesperada, la expectativa original no se 
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confirma y, por ende, disminuye. Tolman y Brunswik (1935) argumentaban que 
tales reglas permiten al organismo aprender acerca de las probabilidades de los 
eventos en su medio ambiente. Brunswik (1939) dirigió una primera versión del 
experimento del aprendizaje de probabilidad con ratas en un laberinto T (véase el 
capítulo 8), e informó que los sujetos a la larga aprendían a igualar sus elecciones 
de porcentaje hacia un lado con los reforzamientos de porcentaje que se daban alí, 

En la época en que Tolman elaboraba sus teorías, se desarrollaba el trabajo ini- 
cial con el reforzamiento probabilístico o parcial (Skinner, 1938; Humphreys, 
1939). En ese trabajo se descubrió que un sujeto reforzado en el 50% de sus res- 
puestas, por ejemplo, seguía respondiendo durante más tiempo en el transcurso 
de la extinción que otro sujeto reforzado en el 100% de sus respuestas. Este efec- 
to de extinción de reforzamiento parcial dio lugar a un persistente dilema para la 
teoría del reforzamiento, E-R pues, ¿cómo podía ser que una respuesta reforzada 
sólo parte del tiempo llegara a ser más fuerte y más resistente a la extinción que 
una respuesta reforzada durante todo el curso del entrenamiento? Con el correr 
de los años se han propuesto e investigado varias ingeniosas soluciones al proble- 
ma, algunas de las cuales se examinan en este libro. Pero una de las hipótesis 
prominentes sugeridas por Humphreys, Tolman y otros es la hipótesis de discrimi- 
nación, insinuada por los experimentos iniciales de aprendizaje de probabilidad, 
La hipótesis establece, en pocas palabras, que las expectancias y la conducta 
cambian a una tasa más rápida cuanto mayor sea la discriminabilidad del cam- 
bio de las condiciones entre el entrenamiento y las series de prueba. Esta hipó- 
tesis alcanzó su enunciación y elaboración más perfeccionada en la teorización de 
Capaldi (1967) que examinamos en el capítulo 9, La hipótesis de discriminación ar- 
monizaba mucho con el pensamiento de Tolman, y el efecto de extinción de refor- 
zamiento parcial (o sus variantes) nunca fue para él una molesta espina como lo era 
para sus contemporáneos, los teóricos del reforzamiento E-R, 


Las expectancias provisionales tomo hipótesis 


En la concepción de Tolman, antes de resolver un problema de aprendizaje, el 
sujeto ensaya activamente varias hipótesis acerca de la naturaleza de las rela- 
ciones (E-R-E*) que existen en el medio ambiente del problema. Una conjetura 
acerca de la solución correcta a un probiema de discriminación podría considerarse 
como una expectancia provisional, Cuando la situación todavía no está es- 
tructurada y las relaciones de la senda hacia la meta todavía no se conocen, la con- 
ducta aún sería ““sistemática””, basada en estas hipótesis o conjeturas provisio- 
nales. 

La evidencia inicial para este punto de vista la proporcionó Krechevsky (1932a, 
1932); 1933a, 1933b), coiega de Tolman. Krechevsky descubrió que antes del 
aprendizaje de un laberinto de cuatro unidades (como indicios de luz en contraposi- 
ción a otros de oscuridad, más los indicios de posición izquierda o derecha en cada 
punto de elección), las ratas adoptaban modos sistemáticos de respuesta que “'en- 
sayarían”” durante un tiempo, para cambiar entonces a un patrón sistemático dife- 
rente, Por ejemplo, un animal podría comenzar al ensayar consistentemente una 
hipótesis de “'dar vuelta a la izquierda”, seguirla durante unos diez ensayos, y 
cambiar durante cierto tiempo a una modalidad de “alternar posiciones en unida- 
des sucesivas del laberinto””, para llegar por último a una hipótesis: ir hacia el 
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Ldo oscuro””, que era la correcta. Krechevsky denominó kipótesis a estas mo- 
dalidades sistemáticas de posibles soluciones, y las contrastó con “el método de 
ensayo y error ciego y aleatorio””, que por lo general se consideraba como la pre- 
dicción de la posición de Thorndike para el aprendizaje por el método de ensayo y 
error, Krechevsky demostró convincentemente que las puntuaciones promedio 
de tiempo o error de grupos de individuos tienden a encubrir la naturaleza siste- 
mática de la manera en que cada uno de ellos ataca el problema. Se suponía que en 
vez de grabar gradualmente en la memoria la respuesta correcta, el efecto del re- 
forzamiento era confirmar la hipótesis correcta, mientras que en los reforzamien- 
tos se usaba como una señal informativa para abandonar una hipótesis provisional 
pero incorrecta. La solución correcta se encontraría de súbito, cuando el animal 
abandonara una hipótesis basada en un indicio irrelevante, y seleccionara entunces 
h correcta, sustentada en ese indicio. La solución al problema era repentina y apa- 
rentemente de “discernimiento”, de una manera muy parecida a la que habían pro- 
nosticado los teóricos Gestalt. Estos experimentos y las ideas asociadas a ellos 
constituyeron los primeros disparos en una controversia duradera y fructífera 
acerca de la continuidad y la discontinuidad en el aprendizaje de discriminación de 
los animales, y los experimentos de la hipótesis presentaron la evidencia inicial 
para el postulado de la discontinuidad. 

La enunciación más clara de una teoría de la hipótesis se debe a Restle (1962) y 
aLevine (1965, 1969, 1970), y la evidencia más contundente es la que este último 
(Levine, 1970) ha recabado al investigar a seres humanos adultos que aprendian 
problemas simples de identificación de concepto. En la figura 11.8 se presenta un 
tonjunto típico de los estímulos en uno de los experimentos de Levine. Aquí los 
patrones de estímulo varían en cuatro dimensiones binarias: forma (Xo 7), tama- 
ño (grande o pequeño), color (blanco o negro) y posición (izquierda o derecha). 
Cada tarjeta contiene un patrón junto a su complemento total; por ejemplo, una X 
grande y negra a la izquierda versus una 7 blanca y pequeña a la derecha. El expe- 
rimentador elige decir correcto cuando el sujeto selecciona el patrón que tiene una 
propiedad particular; por ejemplo, aquellos en forma de T. La tarea del sujeto con- 
siste en aprender a seleccionar el patrón correcto, cuando se muestra cada par. 

La teoría de la hipótesis presupone que un problema de aprendizaje como éste 
puede representarse al afirmar que al comienzo del entrenamiento el sujeto con- 
templa un pequeño conjunto de posibles hipótesis (715) acerca de la solución (por 
ejemplo, una H sería “escoger el patrón izquierdo””). El sujeto probablemente se- 
kccione una A y responda a la tarjeta de acuerdo con esa A; si su respuesta es co- 
rrecta o si no se le da retroalimentación acerca de lo acertado de su elección, con- 
tinúa usando la misma Y en el ensayo siguiente. Si su respuesta se califica como 
eguivocada, entonces se Supone que saca una A distinta de un grupo de hipótesis. 
Esta estrategia de '“ganar-permanecer/perder-cambiar”” para la selección de H 
. garantizará la eventual solución si la H correcta está disponible en el repertorio del 
- sujeto, ya que todas las hipótesis incorrectas a la postre conducen a errores y se 
les descarta, mientras que sólo la hipótesis correcta lleva a respuestas consisten- 


+ temente correctas. 


Levine evalúa la conducta de hipótesis en los seres humanos con el uso de blo- 
ques de prueba de ensayos no retroalimentados (el experimentador permanece 
callado), intercalados entre ensayos retroalimentados cuando a la persona se le 
dice correcto o equivocado por su respuesta. Se cree que los ensayos no retro- 
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Figura 11.8. Ocho patrones de elecciones (los puntos en las columnas a izquierda o 
derecha) que corresponden a cada una de las ocho hipótesis (+1) cuando tos cuatro 
pares de estímulos se presentan consecutivamente sín retroalimentación (tomada de 
Levine, 1970). 


alimentados no originan cambios en la H del sujeto, y que sólo preservan el status 
quo para otro ensayo. La disposición de ensayos con retroafimentación (F) y 
ensayos no retroalimentados (en los cuales se evalúa H;) se muestra en la figura 
11.9. La F, designa el ensayo inicial de retroalimentación, H, la hipótesis inicial 
que se evalúa, FF, el segundo ensayo de retroalimentación, Ha la hipótesis evaluada 
a continuación de F., y así sucesivamente. Las tarjetas en el bloque de prueba es- 
tán dispuestas de tal forma que cada una de las ocho hipótesis simples y distintas 
puede identificarse originalmente mediante el patrón de elecciones a las tarjetas de 
prueba. Por ejemplo, enla figura 11.8, con la secuencia de cuatro tarjetas de prue- 
ba, la secuencia de elecciones “izquierda, izquierda, derecha, derecha'” indica 
que la persona comprueba o mantiene una hipótesis de '“escoger X”' durante ese 
bloque de prueba, Otras ocho de las secuencias posibles de respuesta 2* = 16 
(que no se muestran en la figura 11.8) no corresponderían a ninguna de las hipótesis 
simples de un atributo, y Levine las designaría como Hs más complejas 6 como 
conducta aleatoria, Es importante observar que esta técnica permite al experi- 
mentador examinar la conducta de hipótesis del sujeto (si hay alguna) durante el 
curso de adquisición del concepto, a relacionar la hipótesis real con sus hipótesis 
previas y la retroalimentación recibida más reciente, 

En tales condiciones, la conducta de los adultos se ajusta casi exactamente a los 
postulados de la teoría H. Primero, la mayor parte de los bloques de prueba (más 
del 95%) revela el uso de Hs sistemáticas y simples, con lapsos ocasionales que 
probablemente sean el resultado de errores '*dispersos”*, como los denomina Le- 
vine, Segundo, los sujetos muestran una fuerte tendencia a seguir la estrategia de 
“*ganar-permanecer/perder-cambiar*' para la selección de H' a continuación de un 
ensayo de retroalimentación. Es decir, sia una respuesta se le denomina correcta 
en un ensayo de retroalimentación, la siguiente hipótesis muy probablemente será 
h misma que la del ensayo anterior. 

Tercero, la H correcta a la larga se selecciona y se mantiene generalmente “de 
golpe””, y uno puede observar que rmunca se le había usado antes del ensayo en 
que se seleccionó. Estos son resultados que en 1932 Krechevsky añrmaba haber 
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ENSAYO 


Figura 17.9, Esquema de un proble- 
ma de 16 ensayos que muestra los 
ensayos de retroalimentación (F,) en 
los cuales el experimentador dice 
correcto o equivocado, y los ensa- 
yos en blanco de los cuales se intie- 
ren las hipotesis (la H) [tomada de 
Levine, 1970). 


encontrado con las ratas que aprendían sus retornos en el laberinto. Podemos di- 
sentir de los arreglos restrictivos de los experimentos de Levine o presentar algu- 
nos datos opuestos de animales inferiores acerca de la posición de continuidad 
pero es indudable que el enfoque de comprobación de hipótesis propuesto por 
Xrechevsky y Tolman ha obtenido un gran apoyo experimental y tiene muchos se- 
guidores teóricos (véase Trabasso y Bower, 1968). La teoría aún se cita en la bi- 
hhografía con mucha frecuencia. 


Conducta vicaria de ensayo y error 


Dtro conjunto de observaciones citadas por Tolman y que concuerdan con su 
enfoque aluden al denominado comportamiento vicario de ensayo y error VEE que 
muestran los animales en un punto de elección. Esta conducta, estudiada por 
Muenzinger (1988) y Tolman (1939), entre otros, consiste en la vacilación, la duda 
y la comparación de estímulos alternativos que presenta un animal en un punto de 
elección, antes de que '“se declare en favor” de una o de otra opción. Tolman cre- 
yó que esta exploración y comparación activas de estímulos discriminativos apoya- 
ban la concepción de que el animal considera cada estímulo de elección por turnos, 
que genera expectativas y las confronta antes de elegir. 
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Más tarde, G.H. Bower (1959, 19626) y Spence (19605) proporcionaron des- 
cripciones matemáticas de la conducta del punto de elección en términos de una 
caminata aleatoria, en la cual el organismo se orienta a cada uno de los estímulos 
discriminativos por turno, y se acerca o no a ellos con probabilidades mensura- 
bles. Bower demostró la manera en que ese modelo se ajusta a la estructura pro- 
babilística del comportamiento VEE de las ratas durante el aprendizaje de discri- 
minación simpk. 

Algún tiempo después, Mowrer (1960) y Estes (1962, 19692) desarrollaron la 
idea de un mecanismo de “*exploración de respuesta”*, o de “exploración de estí- 
mulo-respuesta'”, para explicar la selección de respuestas recompensadas y la 
inhibición de aquellas castigadas. La idea era que en una situación de condicio- 
namiento instrumental, el organismo explora internamente a través de un reper- 
torio limitado de respuestas (ya sea de un maneta incipiente o por completo cen- 
tral). Si la consecuencia anticipada para una respuesta es negativa (por ejemplo, 
está asociada con el castigo y el miedo), esa respuesta se inhibe, Si la consecuen- 
cia anticipada para una respuesta explorada es una respuesta positiva alta, enton- 
ces se proporciona retroalimentación facilitativa positiva para '“alentar'' esa res- 
puesta incipiente hasta su terminación. Estas ideas se examinaron en ocasión de 
analizar la teoría de Estes acerca de la recompensa (capítulo 2 y 8), y la teoría 
Sheffield-Estes de la motivación de incentivo (capítulo 4). Pero es evidente que las 
nociones de exploración de estímulo, predicción de recompensas y comparación 
de consecuencias anticipadas, entre otras, son ideas que Tolman hubiera conside- 
rado muy congruentes con su explicación ““cognoscitiva'* de los componentes de 
la toma de decisiones. 


Ideas sistemáticas relacionadas 


A medida que cambian los climas intelectuales, las ideas que se expresaron de 
una forma tienden a presentarse de otras, y tal vez no sean reconocibles, Como se 
ha destacado a lo largo de este capítulo, Tolman se anticipó a muchos de los desa- 
rrollos significativos posteriores en la teoría del aprendizaje. Así, los procesos de 
decisión se han vuelto muy interesantes en la psicología contemporánea, debido a 
la teoría de los juegos propuesta por von Neumann y Morgenstern (1944). Como 
ésta fue adaptada por psicólogos (Edwards, 1954, 1962), se ha despertado un cre- 
ciente interés por la probabilidad subjetiva y la utilidad subjetiva, términos muy sj- 
múlares en significado a las nociones acerca del valor de la expectancia y la valencia 
del objeto de Tolman. La importancia de las probabilidades y del riesgo se pone de 
manifiesto en un artículo de Tolman y Brunswik (1935), en el que se armonizaron 
sus distintos puntos de vista. Esto no quiere decir que las ideas implícitas en la 
teoría de la decisión provengan de Tolman y de Brunswik. Más bien significa que 
si las ideas relacionadas aparecen con formas nuevas, con procedimientos expe- 
rimentales y matemáticos apropiados, no tiene sentido buscar ideas anteriores, 
excepto para señalar que tenían una cierta validez. En un libro que intenta propor- 
cionar una teoría para la psicología clínica, Rotter (1954) desarrolló una acerca de 
la expectancia-reforzamiento, con múltiples puntos de contacto con las concep- 
ciones de Tolman. Su fórmula básica para el potencial conductual convierte a éste 
en una función de la expectancia del reforzamiento y el valor de reforzamiento, del 
reforzamiento esperado. La expectancia de reforzamiento es parecida a los 
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medios-fin-disposición de Tolman, y el valor del reforzamiento corresponde aproxi- 
madamente a la valencia. 

El modelo estructural que propone Deutsch (1960), utilizado para explicar una 
gran variedad de experimentos, representa una forma de pensamiento acerca de 
los problemas psicológicos consonante con las ideas de Tolman. Aunque Deutsch 
propone un modelo tipo '“máquina'” en el cual ésta, que tiene almacenamiento de 
memoria y mecanismo de retroalimentación, puede mostrar conducta por discer- 
nimiento del mismo orden que el de las ratas de los experimentos de Tolman 
(Deutsch, 1954). De hecho, uno de los experimentos más ingeniosos es una repe- 
tición, con algunos cambios, del trabajo de Tolman y Honzik (19304), del que in- 
formaron Deutsch y Clarkson (1959). 

Lawrence y Festinger (1962) presentaron experimentos con una interpretación 
tipo Folman (aun cuando no se diseñaron particularmente en relación con su teoría), 
para probar las predicciones basadas en el concepto de Festinger de la diso- 
nancia cognoscitiva (Festinger, 1957), Éste es un tipo de teoría motivacional deri- 
vada de los experimentos de Lewin acerca del nivel de aspiración, a la que Fes- 
tinger había adherido anteriormente (1942). Dicha interpretación, parecida a la de 
Tolman, puede concebirse debido a la inferencia de procesos cognoscitivos en las 
ratas. 

En sus experimentos, Lawrence y Festinger descubrieron que los animales a 
kss que se ha inducido a ejecutar una respuesta que requiere de mucho esfuerzo, 
encondiciones de recompensa insuficientes (pequeñas, infrecuentes o demoradas 
enrelación con el gran esfuerzo de la respuesta) revelan mayor resistencia a la ex- 
tinción de esa respuesta que sus compañeros ampliamente recompensados. La in- 
terpretación es que la ocurrencia de una recompensa insuficiente a continuación 
de una ejecución difícil induce a un estado momentáneo de disonancia cognos- 
citiva, que resulta desagradable al animal. Un método para reducir esa diso- 
nancia consiste en buscar atractivos intrínsecos en la actividad o en la misma si- 
tuación meta insuficiente, los cuales justificarán las acciones emprendidas. Así, un 
hombre que tiene que recorrer una gran distancia para conseguir un trabajo desa- 
gradable y mal pagado puede comenzar a justificar su permanencia en el empleo 
porque "le gusta el trabajo””, ““obtiene una gran experiencia”, o “la comunidad 
es un lugar muy bonito para vivir”*. En una serie de ingeniosos experimentos, 
Lawrence y Festinger (1962) demostraron la viabilidad de este análisis de la diso- 
nancia cognoscitiva en lo que influía a las ratas para que continuaran ejecutando 
vna respuesta poco recompensada durante una serie de extinción. Festinger 
(1961) resume la teoría con estas palabras: “"terminamos por amar aquellas cosas 
por las cuales hemos sufrido'*, Los resultados de Lawrence y Festinger son pro- 
blemáticos para cualquier teoría que intente explicar una resistencia de la respues- 
ta ala extinción en términos de alguna medición de la fuerza de la respuesta, que 
se incremente cuanto más favorable sea la condición de la recompensa que domine 
ene] transcurso de la adquisición. No obstante, durante muchos años constituyó la 
teoría predominante, y contó con la adhesión de Thorndike, Hull y sus seguidores. 


La teoría de Logan del condicionamiento clásico 

Como un índice de la tendencia actual hacia las formulaciones cognoscitivistas, 
debe mencionarse que Frank Logan, un destacado teórico hulliano, ha propuesto 
una nueva teoría del condicionamiento clásica y del aprendizaje de incentivo cen- 
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trada en un principio de contigilidad sensorio-sensoñal de la asociación (Logan, 
1977, 1979). Reconoce explícitamente que ésta era la tesis fundamental de Tol- 
man acerca de! condicionamiento, En la concepción de Logan, la asociación cog- 
noscitiva de! EC con el El se lleva a cabo en un ensayo, y comienza a decaer con 
el transcurso del tiempo. Los ensayos sucesivos de pares EC-ET establecen hue- 
las múltiples, que en ciertos sentidos son únicas, pero que también son similares 
a lo largo de un gradiente de generalización. La presentación posterior del EC 
puede provocar uno de estos recueydos mediante la generalización, en cuyo caso 
puede activarse una representación del E (como una expectancia). Por lo tanto, 
en palabras de Logan, **el aprendizaje es la memoria acumulativa”. Una vez recu- 
perado, el que un recuerdo particular EC-Ef provoque una respuesta condiciona- 
da, depende, en esta teoría, de diversos factores motivacionales: la intensidad dinámica 
del EC (análoga a la Y en el sistema de Hull), el dinamismo de la intensidad anticipada 
del El, y la disposición dominante (''nivel del impulso'”) para dar la respuesta en 
cuestión (al EP), Con otras premisas, Logan (1977) demuestra matemáticamente 
la manera en que esta teoría explica los resultados estándar en el condicionamien- 
to clásico, los efectos de la intensidad EC, la intensidad El, el nivel del impulso en 
el condicionamiento apetitivo, la discriminación temporal, y otras cuestiones 
menores. 

Logan maneja la extinción que sigue a la adquisición al presuponer dos pro- 
cesos: primero, que hay un decremento en la expectancia de que el El ocum- 
rá a continuación del EC; y segundo, siel El no se presenta cuando se le espera- 
ba, hay un incremento en la expectancia de que el El no ocurrirá después del EC. 
En la teoría de Logan, esta segunda expectancia es el equivalente de la inhibición. 
Una regla que estipula cómo se comprometen estas tendencias permite a Logan 
tratar con la extinción y con la ejecución estable bajo el reforzamiento parcial. 

Al discutir la extinción y el reforzamiento parcial, Logan recurre a ideas como 
las de Capaldi (véase el capítulo 9). La adquisición de la respuesta condicionada 
tiene lugar cuando el £C se presenta en el contexto del estímulo, a continuación 
de los ensayos recompensados. En contraste, los ensayos de extinción ocurren en 
el contexto de ensayos previos no recompensados, y esto es una fuente de decre- 
mento de generalización para la recuperación de los recuerdos EC-El (expectan- 
cias). 

Par lo tanto, la extinción se produce con rapidez después del entrenamiento de 
reforzamiento continuo, pero no después del parcial. 

A esta teoría Logan la denomina híbrida, y reconoce la combinación de ideas de 
varias fuentes: Tolman, Spence, Capaldi, Estes, Rescorla y Wagner, Al parecer, 
la combinación tiene un poder impresionante, y la teoría describe muchos fenóme- 
nos del condicionamiento clásico. Además, Logan cree que el condicionamiento 
clásico sustenta la motivación de incentivo para las respuestas instrumentales; es- 
pecíficamente, los estímulos de retroalimentación de la respuesta correcta se con- 
dicionan de modo clásico al reforzador y, por lo tanto, conducen a una expectancia 
del mismo (Logan, 1979). Además, el aprendizaje instrumental todavía requiere 
de la premisa de que las asociaciones de estímulo-respuesta se adquieren y se 
Usan para guiar la respuesta operante. En muchos aspectos, la teoría de Logan es 
muy parecida a la de Estes (1969), al suponer que ambas asociaciones E-E y E-R 
son necesarias para apoyar la respuesta instrumental. Éste es otro ejemplo de 
convergencia en la teorización contemporánea. 
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MEMORIA ESPACIAL Y MAPAS COGNOSCITIVOS 


Tolman empleó el atractivo término mapa cognoscitivo para caracterizar el cono- 
cimiento que tenían sus ratas de la disposición espacial de sus laberintos. Por des- 
gracia, el investigador y sus discípulos no desarrollaron una gran teoría acerca de 
los mapas cognoscitivos. Comprobaron la predicción de que cuando se bloquea 
una senda que lleva a la meta, el animal tomaba la siguiente alternativa asequible o 
ta desviación más corta para salvar la barrera, predicción que obtuvo un apoyo ge- 
neral. Los recientes experimentos con ratas (Clton, 1979), chimpancés (Menzel, 
1973, 1978), y seres humanos (Gould y White, 1974, Moar, 1979, 1980) cumen- 
zaron a explorar sistemáticamente la forma en que el organismo aprende y utiliza 
información acerca de la ubicación de objetos en el espacio circundante. Aquí 
reseñaremos parte del trabajo acerca de la memoria espacial en las ratas, de que 
informa Otton, y después se verá el estudio de Menzel relativo a los chimpancés. 

La teoría del reforzamiento se basa en la premisa de que la recompensa a una res- 
puesta se graba en la memoria, y que convierte a la estereotipia (fjeza conductual) 
en una eventualidad probable. Sin embargo, la estereotipia conductual no es siem- 
pre la forma más adaptativa de ajustarse a un ambiente dado. Olton señala que las 
ratas son similares a muchas otras especies en sus estrategias naturales para en- 
contrar comida dispersa en el terreno, Una vez que la rata la encuentra y la consume, 
busca alimento en otra parte y no vuelve a ese lugar durante algún tiempo. Quizá esta 
estrategia se ha desarrollado durante muchas generaciones, a medida que las es- 
pecies se adaptan a un ambiente específico, pero implica que las ratas muestran 
una gran variabilidad de comportamiento al explorar un espacio en el cual se ha 
colocado comida. A 

Durante muchos años los investigadores intentaron enseñar hábitos de respues- 
ta estereotipada a Jas ratas que aprenden a encontrar comida en un laberinto, y 
quedaron sorprendidos por el nivel elevado de “alternancia espontánea" y explo- 
ración exhaustiva que los animales demuestran antes de hacer lo que el expe- 
rimentador quiere que hagan. Los animales se dedican a explorar y a aprender la 
disposición espacial de los brazos del laberinto; al comienzo no parecen dispuestos 
a creer que encontrarán alimento en el mismo lugar. Incluso sí no hubiese comida, 
de todas maneras las ratas aprenden a explorar un laberinto complejo de modo sis- 
temático, a recorrer las diversas sendas en cada ensayo, y raras veces regresan a 
una que ya han visitado en ese ensayo (Uster, 1976; Uster et al., 1976) Por su- 
puesto, para llevar a cabo esas eficientes exploraciones, la rata debe haber apren- 
dido la disposición del laberinto y recordar sus exploraciones en los ensayos ante- 
riores. 

Olton y Samuelson (1976) ofrecieron una brillante demostración de este tipo de 
memoria espacial de corto plazo en un experimento con ratas, usando el laberinto 
elevado de brazos radiales que se muestra en la figura 11.10. Una bolita de al- 
mento está oculta al final de cada brazo del laberinto, y se permite a la rata que lo 
explore hasta que encuentre las ocho bolitas. La ejecución óptima sería visitar una 
sola vez cada brazo, sin repetición, Las ratas aprendieron rápidamente a desem- 
peñarse en esta tarea, para escoger a la postre un promedio de 7.9 diferentes bra- 
zos en las 8 primeras elecciones. Evidentemente, los animales pueden recordar 
dónde han estado dentro de cada ciclo de ensayos, y evitan esos lugares. Olton y 
Samuelson (1976) demostraron que las ratas no logran este alto nivel de ejecución 


434 Segunda parte. Teorías cognoscitivoorganizacionales 


con el uso de indicios intralaberínticos (por el olor de la comida o por ensayos pre- 
vios con los olores) ni por movimientos sistemáticos (por ejemplo, siempre dar 
vuelta a la izquierda al salir de uno de los brazos del laberinto), Por el contrario, las 
ratas dependen de indicios visuales extralaberínticos, que pueden ver desde los 
brazos elevados, y sólo verifican en la memoria aquellos lugares que han visitado 
en un ensayo dado. Olton (1979) revisó pruebas posteriores que demuestran una 
memoria de corto plazo todavía más espectacular para las ubicaciones espaciales 
que las ratas visitaban. Es evidente que tales ejecuciones son exactamente lo con- 
trario de la estereotipia de respuesta que suele recalcarse en los experimentos del 
aprendizaje: pero las visitas repetidas al mismo lugar no se refuerzan en este labe- 
rinto de brazos radiales. 

Otros experimentos de Olton demuestran que después de familiarizarse con un 
complicado laberinto en el que se proporcionaban recompensas en una ubicación, 
la rata irá a ese lugar con menos errores mediante un atajo, cuando se la someta a 
prueba al colocarla en nuevos puntos de partida. Así, el animal demuestra ser 
capaz de orientarse en un campo desde una perspectiva nueva, y encontrar su ca- 
mino hasta la meta. La ejecución es muy similar a la de los seres humanos cuando 
usan su conocimiento del mapa de una nueva ciudad para llegar a un destino cono- 
cido desde un nuevo punto de partida. Observan la dirección hacia hitos familiares, 
se aproximan a ellos, se orientan en la dirección de los signos para acercarse más 
2 la meta, y continúan combinando fragmentos de rutas conocidas. en forma de 
bloques, hasta que logran llegar a su destino. Un modelo teórico completo no ha 
logrado explicar aún esas ejecuciones, aunque algunos investigadores de la inte- 
ligencia artificial (por ejemplo, D.V, MecDermott y B.J. Kuipers) han comenzado a 
estudiar el problema de cómo se integra la información de ruta local en una estruc- 
tura parecida a un mapa. La adquisición, la representación y el uso de la informa- 
ción espacial en la ejecución promete ser un área de investigación avanzada y de 
ideas interesantes. A modo de ilustración, seguidamente examinaremos la inves- 
tigación de Menzel acerca del aprendizaje de mapa de área en los chimpancés. 


Mapas cognoscitivos en los primates 


Es una lástima que Tolman y sus seguidores escogieran a la rata como sujeto 
para demostrar el aprendizaje de orden superior y el razonamiento inferencial, ya 


Figuera 11.10. Laberinto elevado de brazos ra- 
diales. Una recompensa de comida se oculta al 
final de cada brazo y el animal corre hasta que 
la encuentra (tomada de Olton, 1979), 
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que las habilidades de este animal parecen muy limitadas. Si hubieran trabajado 
con monos o chimpancés en su ambiente natural, habrían descubierto rápidamente 
centenares de ejemplos de inteligencia en el uso de herramiéntas, en la aplicación 
de nocimiento espacial, en la negociación mediante relaciones sociales con ad- 
versarios más fuertes, etcétera. Varios psicólogos y etólogos han observado du- 
rante muchos años colonias de chimpancés en su ambiente natural o en un gran 
campo experimental, y han reunido un importante conjunto de agudas observa- 
ciones acerca de los comportamientos inteligentes y sociales de estos animales 
(van Lawick-Goodall, 1971; Menzel, 1973, 1974, 1978). A continuación se descri- 
ben algunas de las observaciones de Menzel en un grupo de chimpancés, a medida 
que éstos se familiarizaban con un nuevo campo experimental que podían explorar 
sólo durante algunas horas al día 

Inicialmente Jos chimpancés temen aventurarse en un terreno desconocido, de 
modo que al comienzo el grupo permanecía cerca de la construcción par la que en- 
traban al campo. Poco a poco, el grupo exploraba más el territorio y se familia- 
rizaba con él. Los machos de mayor edad exploraban el nuevo territorio con más 
rapidez que las hembras o los machos jóvenes. Los animales se movían en grupo y 
permanecían próximos a los árboles, a otras estructuras elevadas o cerca de los lu- 
gares donde pudieran ocultarse. Después de familiarizar a los chimpancés con el 

campo, Menzel introducía cada día algún nuevo juguete (como un oso de felpa o 
wa ta en distintos lugares. Unos minutos después de que habían sido libe- 
rados en el campo, los chimpancés descubrirían el juguete, se dirigirían a él en lí- 
nea recta, lo examinarían y se pondrían a jugar con él. La detección de un objeto 
nuevo implica una familiaridad total con los antiguos objetos del campo. 

Menzel daba entonces a los chimpancés una versión de la búsqueda del huevo 
de Pascua, a la cual denominó **problema del agente viajero?”. Un experimentador 
llevaba a un chimpancé mientras un segundo experimentador le mostraba al simio 
dónde ocultaba 18 piezas de una fruta apetecida. En la figura 11.11 se ilustra un 
mapa, para cuatro diferentes chimpancés, de las ubicaciones de los 18 lugares 
donde se encontraba la fruta en un ensayo dado; los números dentro del círculo in- 
dican el orden en el que se le mostraban al animal estos sitios ocultos. Después de 
este ensayo de observación, se liberaba al animal en la entrada del campo. El he- 
cho notable es que éste corría directamente a los lugares donde se ocultaba la fru- 
ta, se la comía, corría al siguiente lugar, y así sucesivamente. Las sendas de los 
cuatro animales en el mejor ensayo de cada uno se muestran al seguir las lechas a 
partir de s (comienzo) en la figura 11.11. Los chimpancés recordaban la mayor 
parte de los lugares ocultos (de 15 a 18); y las observaciones de contro] probaron 
que no lograban hacerlo mediante el olfato o al mirar casualmente la comida mien- 
tras corrían por el campo. Además, usaban una ruta muy eficiente para encontrar 
la comida, y establecían algo parecido a una senda de menor distancia. El orden en 
que visitaban los sitios donde se escondía la comida estaba determinado por su 
proximidad en el espacio, no por el orden temporal en que se mostraban al chim- 
pancé esos lugares. La senda es semejante a la del agente viajero que debe visitar 
clentes en 18 ciudades distintas, y quiere recorrer la menor distancia posible. Por su- 
puesto, el vendedor lo hace un poco mejor porque dispone de un mapa real para 
orientarse, en el cual puede marcar todos los lugares que debe visitar (un dispo- 
sitivo de memoria externa). Pero los chimpancés sólo tienen sus mapas mentales 
(cognoscitivos) y deben recordar los lugares que se les mostró una sola vez. Asi- 


Figura 11.11. Mapas que mues: 
tran las ejecuciones de cuatro 
chimpancés en una búsqueda del 
tipo del “huevo de pascua”. Los 
números dentro de los círculos 
indican el orden en el cual los 
simios fueron expuestos a la co- 
mida que se escondía, La senda 
con flechas desde el comienzo(s) 
indica el arden en que visitaron 
los lugares con alimento, Los círcy: 


15m q comienzo los a los que no toca la línea 
Escala e me o —Orden en al cual se no se visitaron (tomada de Men- 
mostraba ta comida zel, 1973), 
al sujeto 


mismo, los chimpancés tenían ensayos múltiples durante varios días con diferen- 
tes lugares donde se ocultaba la fruta; sin duda, los patrones anteriores interferían 
ligeramente con el recuerdo del patrón actual de las ubicaciones de la comida. 

Parecía que los chimpancés elegían señales para recordar los lugares de ocul- 
tamiento: cuando se mostraba el sitio donde se escondía la comida, el chimpancé 
buscaba algún objeto prominente en la cercanías (por ejemplo, un árbol, un puen- 
te) y un indicio local específico (un cactus color marrón), como si asociara la comi- 
da con estas señales, Estas guiaban entonces la búsqueda posterior. Los errores 
cometidos se debían a la confusión de las señales locales (por ejemplo, buscar de- 
trás de un poste adyacente), de una forma muy parecida a como los seres huma- 
nos cometerían pequeños errores. En otras pruebas, Menzel demostró que, si 
todo lo demás permanecía constante, el chimpancé acudiría primero a la comida 
que se encontraba más cerca, a la más apetecida, y a aquel lado del cota donde ha- 
Bía más alimento. 

En un experimento posterior acerca de la observación remota, se inmovilizaba a 
los chimpancés a la entrada del recinto, desde donde miraban a un experimentador 
que caminaba por el cato y ocultaba varias piezas de comida, señalando cada lugar 
al mostrar ostensiblemente el alimento antes de esconderlo. Incluso en esta situa- 
ción de observación remota, los chimpancés se desempeñaban notablemente bien 
cuando echaban a correr nmbo a la comida, en el momento en que se les hberaba, 

En un trabajo final, el experimentador señalaba al chimpancé la ubicación de una 
sola pieza de comida en el coto, o caminaba unos cuantos pasos en su dirección, 
mientras el animal lo miraba. Esta señal social servía para orientarlo; cuando se lo 
liberaba después de varios segundos, echaría a correr en la dirección que indicaba 
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el experimentador, y casi siempre encontraba la comida. En otro experimento, el 
investigador escondía en el coto una pila de comida grande y otra pequeña en cada 
ensayo (fuera de la vista del chimpancé); entonces le mostraba la localización de la 
pila grande, a la cual señalaba con la mano, caminando además 15 pasos en su di- 
rección. También indicaba la ubicación de la porción pequeña al señalarla con la 
mano y caminar sólo 5 pasos hacia ella, Después de unos cuantos ensayos para 
aprender el significado de las dos señales, cuando se liberaba al animal éste bus- 
caba de inmediato en la dirección que apuntaba a la pila grande de cornida; después 
de encontrarla, el chimpancé iba hacia el lugar indicado para la pila pequeña. Se di- 
señaron otros proyectos para someter a prueba a los chimpancés con indicios más 
simbólicos, como películas o fotografías, de la dirección de la comida desde la en- 
trada al recinto. 

Tales experimentos revelaron que los chimpancés educados tienen una memo- 
Jia notable y son capaces de planear sendas que conducen a la meta, Sin embargo, 
estos resultados dependen de que los aniniales estén completamente familiari- 
zados con una localidad específica, de una forma muy parecida a como aprenderían 
ensu hábitat natural. Siempre mostraban mucha curiosidad por explorar cualquier 
objeto nuevo introducido en un terreno familiar. (Esta circunstancia frustró el im- 
tento de Menzel de estudiar la habilidad de los chimpancés para maniobrar alre- 
dedor de obstáculos nuevos y llegar a la comida; los animales se interesaban tanto 
por explorar ese obstáculo que no se preocupaban por el alimento.) En su búsque- 
da de comida y en sus interacciones sociales cotidianas, los animales revelaron 
que podían planear, emplear herramientas, utilizar señales de comunicación social 
y salvar los obstáculos. Por ejemplo, si un chimpancé sabe dónde se oculta una 
banana pero hay otro animal dominante entre Él y el alimento, idea una forma para 
rodear al animal más fuerte —tal vez alejarla mediante un engaño— y conseguir el 
plátano. La planeación inteligente de las acciones y las interacciones es notable y 
sorprendente. A Tolman le hubiera gustado observar a tales criaturas. 

Menzel cree que los chimpancés elaboran algo semejante a un mapa cognosci- 
tivo a medida que se familiarizan con el coto, y localizan todas las señales grandes 
y los indicios locales cercanos relacionados unos con otros. Entonces asocian al 
alimento con señales específicas para las ubicaciones en este mapa, y calculan 
cómo llegar a esos lugares. Subsiste una pregunta interesante que se refiere a la 
manera en que se integran las diversas exposiciones locales con diferentes partes 
del espacio. Investigaciones posteriores se han centrado en la habilidad humana 
para construir un mapa cogmoscitivo a partir de una limitada exposición a una ciu- 
dad o edificio nuevos (Gould y White, 1974). Sin embargo, en una perspectiva his- 
tórica, las observaciones acerca del uso y el aprendizaje de mapas en los primates 
constituyen la evidencia más importante para la teoría del mapa cognoscitivo, de 
Tolman. 


COMENTARIOS FINALES EN TORNO DE 
LA INFLUENCIA DE TOLMAN 


Mientras algunos experimentos recientes han demostrado su origen directo en 
la teoría de Tolman, otros desarrollos contemporáneos pueden deberse a éste y a 
su influencia. Es evidente que Tolman planteó a las teorías de estímulo-respuesta 
muchos de los persistentes problemas con los que ha tratado; por ejemplo, la dis- 


438 Segunda parte, Teorias cognoscitivoorganizacionales 


tinción entre aprendizaje y ejecución, aprendizaje latente, anticipación de metas y 
motivación de incentivo, conducta de comprobación de hipótesis, el perfecciona- 
siento de la caracterización de “lo que se aprende”, etcétera. La teorización del 
estímulo-respuesta se desarrolló y madurá mucho más allá de Watson, Thorndike 
y Pavlov debido a los grandes retos planteados por los teóricos cognoscitivistas, 
que a menudo fueron los primeros en indicar algún área nueva de problemas acer- 
ca del aprendizaje, Esto fue por completo saludable, y en nuestra época ha llevado 
a una especie de coalición entre las diferentes teorías del aprendizaje, en una sín- 
tesis cuya índole no fue siquiera imaginada por sus protagonistas originales. El 
hecho de que las teorías cognoscitivistas del aprendizaje anima! han ganado popu- 
laridad se manifiesta en un volumen reciente titulado Cogritive processes in animal 
learning (Bulse et al., 1978). 

Cabría preguntarse qué tipo de contribuciones científicas tiene probabilidades 
de sobrevivir. Un sistema global, a no ser que sea muy hábil para agrupar un cier- 
to número de hechos empíricos correctamente estipulados (la ley de Newton, la 
teoría de la relatividad, de Einstein), tiene menos posibilidades de perdurar que 
una sola relación bien establecida (el principio de Arquímides, la ley de Ohm, la ley 
de Weher-Fechner). El sistema de Tolman no era lo bastante riguroso como para 
perdurar y, aunque no hay ninguna *ley de Tolman'” que le confiera inmortalidada 
su creador, es probable que el experimento del aprendizaje latente sea tan sin- 
gularmente suyo como las sílabas sin sentido lo fueron de Ebbinghaus. Algunas de 
estas contribuciones menos importantes, a medida que ingresaron en la corriente 
de la ciencia, pueden ser suficientes para que sus autores ganen una merecida 
posición en la historia del quehacer científico. 

Sin embargo, se espera algo más, ya que para que se muestre en toda su ple- 
nitud el avance de la ciencia (en este caso, la psicología), prevalece la necesidad de 
relaciones objetivas firmes, a partir de las cuales construir en el futuro las teorías, 
u originar el nacismento de nuevos paradigmas que le dan una apariencia renovada, 
como lo señala Kuhn (1962). Vista en retrospectiva, es probable que la contri- 
bución de Toiman haya sido de este segundo tipo, y que haya proporcionado un 
nuevo semblante al conductismo al insistir en que permaneciera abierto a los pro- 
blemas creados por los procesos cognoscitivos, la solución de problemas y la idea- 
ción inventiva. El tipo de programa que Tolman concebía comienza a fructificar en 
la psicología cognoscitivista moderna. 


LECTURAS COMPLEMENTARIAS 


El único libro especializado en el sistema Tolman es: 
Tolman, E. C., Pusposive behavior in animals and men, 1932. 


Afortunadamente, sus breves escritos están teunidos en el libro: 
Tolman, E. C., Collected papers in psychology, 1951. 


Se publicó un prefacio y un resumen fina) de su teoría en: 
Tolman, E. C., “Principles of purposive behavior”*, en S. Koch (dir.), Psychology. A study 
of a science, vol. 2, 1959. 
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Se encuentra disponible un hibrito interesante acerca de la motivación, el cual fue retj- 
tulado debido a la Segunda Guerra Mundial: 
Talman, E. C., Drives toward war, 1942. 


Para una revisión completa de la teoría de Tolman, con algunas sugerencias respecto a la 
sistematización, véase: 
MacCorguodale, K, y Meehi, P. E., *'Edward C. Tolman”, en W. K. Estes et al., (dirs.), 
Modern learning theory, 1954, págs. 177-266. 


Teorías del procesamiento 


de información 


de la conducta 


Una técnica reciente de teorización psicológica implica la formulación de teorías 
en forma de programas que se utilizan en computadoras de alta velocidad. El ob- 
jetivo es lograr que dicho programa de computadora lleve a cabo una serie de ac» 
ciones que en ciertos rasgos esenciales se parecen a —o simulan— las acciones 
cognoscitivistas o conductuales de un sujeto real que ejecuta una determinada ta- 
rea. En este capítulo se examina y se espera esclarecer esta breve enunciación in- 
troductoria; así, revisaremos principalmente algunas de las teorias y los modelos 
que se han formulado de esta manera. 

Los antecedentes históricos de la técnica teórica a que nos referimos son di- 
versos, y muchos de los modos de pensamiento se tomaron de la ingeniería. Tal 
vez una forma apropiada de comenzar sea aludiendo al antiguo arte de la roboto- 
logía. Desde hace mucho tiempo, el ser humano se ha sentido fascinado por las 
similitudes entre el “comportamiento” de las máquinas y la conducta de los orga- 
nismos vivos. Allí se encuentran todas las analogías, implícitas en nuestras ha- 
bituales descripciones de lo que hacen las máquinas. La robotología consiste en el 
diseño de máquinas que imitan la conducta de los organismos vivos. Después de 
un comienzo lento, los recientes avances son tan espectaculares que le han confe- 
rido una gran importancia a esta empresa. Ahora se reconoce ampliamente que 
pueden diseñarse máquinas para ejecutar muchas tareas que antes sólo realizaban 
los seres humanos. De hecho, la máquina puede a veces superar al hombre. El 
efecto de esta proeza de ingeniería es evidente en la preocupación actual por la au- 
tomatización y la posible sustitución del trabajador humano en el futuro. 

Durante la década de 1950 algunos científicos conductistas comenzaron a cons- 
truir robots que supuestamente encarnaban diferentes principios de la conducta. 
Entre esos modelos se cuenta el homeostata, de W, R. Ashby (1952), que busca y 
mantiene una homeostasis favorable de su “medio interno*”; la machina specula- 
tmix, de Walter (1953), que imita las acciones de un animal que explora su medio 
ambiente en busca de comida o de refugio; las máquinas de aprendizaje, de Walter 
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(1953) y Deutsch (1954), que imitan el aprendizaje de las ratas en un laberinto; la 
máquina de Hoffman (1962), que muestra la mayor parte de los fenómenos del 
condicionamiento clásico, y otras que mencionaremos más adelante. 

Cabe preguntarse si a estos rabots se les debe considerar en serio. ¿Cuál es su 
estatus lógico? ¿Han de estimarse como explicaciones serias de la conducta o sólo 
como curiosidades divertidas pero inútiles? El consenso es que una máquina que 
simula con exactitud ciertos aspectos inherentes a la conducta de un organismo sin 
duda constituye una genuina explicación de esa conducta. La idea es que los princi- 
pios abstractos comprendidos en el diseño de la máquina (sus componentes fun- 
cionales y la organización de éstos) podrían en verdad ser los mismos que descri- 
ben el diseño y el funcionamiento del organismo vivo. Al diseñar y construir una 
máquina para simular ciertas conductas, de hecho resolvemos la estructura física 
de una teoría acerca de la forma en que el organismo produce la conducta. Lograr 
que la máquina funcione realmente y simule alguna conducta de interés es una ma- 
nera de demostrar que la teoría tiene consistencia interna, y que ha especificado 
w conjunto suficiente de mecanismos. Hacer que el robot ejecute una u otra tarea 
equivale lógicamente a construir teoremas acerca de la conducta a partir de la teo- 
ría que es modelada por la ejecución física. Por otra parte, se afirma que compren- 
demos totalmente una porción de conducta cuando sabemos cómo construir una 
máquina que se comporte de ese modo. 

La diferenciación que efectuamos entre una teoría abstracta y su modelo mecá- 
nico particular es similar a da distinción lógica entre un sistema de axiomas y las va- 
ñas realizaciones de éste. La teoría o el sistema de axiomas tiene prioridad lógica; 
las realizaciones físicas particulares son secundarias. En este sentido, no es psico- 
lógicamente pertinente qué material se emplee para construir los robots, ya sean 
medas dentadas, relevadores, tubos aspiradores, transistores, procesos electro- 
químicos, o neuronas reales (si el neurofisiólogo se preocupa por el material real). To- 
das las realizaciones apropiadas de la teoría llevarán consigo algunas conductas ís0- 
mórficas; es decir, mostrarán un paralelismo o correspondencia punto por punto 
en la senda conductual que trazan a través del tiempo. Si dos sistemas muestran 
este tipo de paralelismo funcional, esa correspondencia punto por punto de carac- 
terísticas críticas, se dirá que un sistema es una simidación del otro. Si la corres- 
pondencia es lo bastante amplia, tendremos razones para creer que los dos sis- 
temas son diferentes realizaciones de la misma teoría. En la práctica científica, 
esto significa que una teoría acerca de la conducta podría probarse mediante la 
construcción de una máquina diseñada de acuerdo con ella, y observar después si 
esta máquina simula la conducta de interés. 

Pero al llegar a este punto de la argumentación podemos comenzar a examinar 
el material, lo cual se logra sálo al atender a las características esenciales —en 
oposición a las que no lo sean— del sistema a simular. Evidentemente, esto se de- 
termina por las metas que se hayan establecido, Por ejemplo, supongamos que 
Tuestro objetivo es simular la conducta de una rata en el aprendizaje de un labe- 
rinto. No importa que nuestro robot se parezca o no a una rata, o se mueva sobre 
Tuedas en lugar de desplazarse por medio de patas o, por lo que a eso concierne, 
que sólo nos informe (mediante algún recurso) de lo que haría si dispusiera de pa- 
tas para moverse. Todo lo que una explicación psicológica requiere es que nues- 
tro robot esté equipado con: 4) un sistema seudosensorial a través del cual reciba 
información *. tos estímulos de su ambiente, quizá con elementos sensibles acce- 
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CONCEPTOS Y MODELOS DE PROCESAMIENTO 
DE INFORMACIÓN 


Cada nuevo enfoque teórico suele crear su propio lenguaje descriptivo —su jer- 
ga— y así ha sucedido con el de simulación por computadora, La terminología es la 
del “procesamiento de información'”, y se deriva de la forma en que los científicos 
de la computación generalmente describen lo que hacen las máquinas. Los estf 
mulos, datos, instrucciones (el nombre genérico es ““información'”), constituyen 
h entrada (input) —son introducidos (read im)— en la computadora; después de 
ciertos procedimientos, el aparato produce (outputs reads out) algún resuitado final 
particular, usualmente impreso o mediante una figura en un tubo de rayos catódi- 
cos, Entre la entrada y la salida (input, owtpub), la computadora ejecuta una serie 
de operaciones ordenadas sobre los datos de entrada. Estas pueden consistir en la 
alleración o transformación de la masa de datos, en calcutar algo relacionado con 
ellos, compararlos con alguna otra cosa, usar el resultado para buscar un dato pre- 
viamente almacenado, evaluar lo que se encuentra en etapas intermedias, tomar 
decisiones acerca de ello, etcétera, Cada una de estas manipulaciones tal vez re- 
quiera de una breve serie de instrucciones en el programa de la computadora, que 
se denomina subrutira. Es conveniente referirse a las subrutinas en términos 
delas funciones que ejecutan con la información que se les suministra. Y a partir de 
esto, es fácil comenzar a referirse a la subrutina coro la representación de un se- 
canismo de procesamiento de información. Así, las teorías de simulación conductual 
por computadora por lo general pueden describirse en el sentido de que postulan 
h existencia, dentro del organismo, de un conjunto de mecanismos de procesa- 
miento de la información, cada uno de los cuales ejecuta cierta función elemental, y 
se presume que estos procesos están organizados y ordenados en secuencias de 
algún modo particular. 

Es conveniente describir la mayor parte de las investigaciones en el área del 
procesamiento de información (PJ) como un esfuerzo concertado hacia la síntesis 
experimental de conductas humanas complejas. Algunas clases típicas de conduc- 
tas que se simulan incluyen el razonamiento de un campeón de ajedrez al seleccio- 
nar su siguiente movimiento durante una partida, la generación de hipótesis de un 
sujeto que resuelve una tarea de formación de conceptos, la selección de acciones y 
otrus valores en Jos que un corredor de bolsa puede invertir sabiamente el capital 
de sus clientes, etcétera. Los modelos intentan retratar y comprender la conduc- 
ta humana en lo que toca a sus máximas capacidades racionales, Por lo tanto, en 
concepción y en objetivos, los modelos PJ están muy alejados del enfoque tradi- 
cional de estímulo-respuesta, con su énfasis en análisis progresivamente finos de 
porciones conductuales más simples y reducidas, En contra de esta tradición analí- 
tia, las teorías PI han tratado de sintetizar las conductas complejas y construir 
modelos cuyas capacidades igualen a las del ser humano. 

Para sintetizar una porción compleja de la conducta (por ejemplo, comprobar un 
teorema en lógica simbólica), el teórico tiene que especificar muchos procesos, 
así como la compleja organización de todos ellos. Además, deben puntualizarse 
muchas reglas de decisión condicional que estipulen de un modo u otro cómo se 
desplazará el modelo durante su búsqueda, lo cual depende del resultado de los 
cálculos previos, ¿De qué manera recabaremos información acerca de las capaci- 
dades de ejecución de un sistema tan complejo? Como hemos visto, sería muy difí- 
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cil seguir su operación paso por paso usando papel y lápiz. Pero para abreviar el 
procedimiento, al sistema se le programa como una secuencia de instrucciones 
que la computadora llevará a cabo, Al hacer correr el programa en la computadora 
y al lograr que ésta imprima sus acciones, aprendemos acerca de sus capacidades, 
Ante todo, aprendemos si el sistema se ha especificado de una manera lo bastante 
completa como para que funcione; tal vez deban especificarse más partes o elimi- 
nar algunas contradicciones internas. Segundo, observamos si la conducta sintéti- 
ca que imprime muestra las características particulares que deseamos duplicar. 
Tercero a partir de diferentes corridas podemos determinar cómo cambia la con: 
ducta de todo el programa cuando modificamos partes seleccionadas del mismo. 

Las computadoras se programan escribiendo una secuencia de instrucciones, 
por lo común extensa, que deben ejecutarse ya sea con alguna información de 
entrada o con base en la que está almacenada en los bancos de memoria de la máqui- 
na. La secuencia total de instrucciones se denomina programa. Estos deben escri- 
birse en un formato preciso, empleando algún lenguaje estandarizado que la com- 
putadora pueda “comprender”. Los lenguajes FORTRAN y ALGOL se utilizan 
comúnmente en los programas que realizan cálculos numéricos ordinarios. En la 
figura 12.1 se observa el diagrama de flujo de un programa simple. Como datos te- 
nemos los pesos de 12 personas; el programa ha de calcular su peso promedio. 
Hacemos que x(1) = 1, 2,... 12 represente los doce números. Éstos se perforan 
en las tarjetas 1BM y se le dan a la computadora. En el programa, SUM es nues- 
tra denominación para una célula de me moria que usamos como un espacio de tra- 
bajo temporal. La secuencia de instrucciones se describe en la figura 12.1. El 
componente principal es el “circuito cerrado”, que agrega x(1) a SUM e incre- 
menta 7 en 1. Este circuito cerrado se ejecuta 12 veces, y el programa pasa a las 
operaciones de división e impresión, 


Una simulación simple 


Aunque este ejemplo ilustra cálculos numéricos, una hgera variante del progra- 
ma que tiene contenido psicológico emplearía un circuito cerrado para buscar una 
lista memorizada de elementos, para verificar si contiene un reactivo crítico. 
Sternberg (1969) y otros han estudiado ampliamente esta tarea, que indica cómo 
se realiza la búsqueda en la memoria de corto plazo. El programa operativo para 
simular la ejecución en esta “tarea de Sternberg”? se ilustra en la figura 12.2, don- 
de la hemos dividido en pequeños pasos. El ensayo típico comienza al cargar la 
memoria de corto plazo con una pequeña lista de dígitos o letras, que en la figura 
12.2 se denotan como x(1), x(2),...x(1V), Por el momento, piénsese en x(1), 
x(2),... x(V) como N diferentes células de almacenamiento en la memoria que 
mantienen los reactivos de la lista, por ejemplo, las letras Q, W, F, G. Entonces 
damos la letra de sondeo (por ejemplo, 7), y el sujeto ha de decidir tan rápido 
como le sea posible si el sondeo forma parte del conjunto de memoria. Como nos 
interesamos por el tiempo que aj sujeto le insume tomar su decisión, en nuestro 
modelo usamos un reloj interno denominado RT, y lo ponemos en marcha a partir 
del momento en que se presenta el sondeo. El programa operativo recupera un 
elemento del conjunto de la memoria (una operación que lleva el tiempo +), compa- 
ra este elemento con el sondeo (comparación que lleva el tiempo c), responde sí si 


445 


Suma de 
conjunto = 0 


Conjunto? = 1 


Circuito 
cerrado 


Sumy de conjunto 
= suma + xí% 


Figura 12.1. Diagrama de flujo 
que describe los pasos para cal- 
cular el promedio de 12 números 
designados x(1), x(2)..., x(12). Para 
calcular la suma de esos núme- 
ros se usa un circuito cerrado, 
empezando con x(1) En cada 
paso a través del circuito, el indi- 
ce [se aumenta en +1; después 
de que el x(12) se agrega a la 
suma, el programa sale del cir- 
cuito cerrado, calcula el valor 
promedio y lo imprime. 


¿Esi= 12? 


Conjunto AVE 
= Suma/12 


imprimir AVE 


Conjunto! =/+ 1 


se iguala al sondeo, pero continúa con la exploración del elemento siguiente de la 
lista si el x(7) actual no se equipara. La pregunta “¿es / = N?"' se usa para decidir 
si se ha explorado la lista completa de la memoria. En caso negativo, el índice se 
actualiza y se pasa al siguiente elemento de la lista; si se la ha explorado toda sin 
encontrar un elemento que se iguale a la sonda, el programa termina por imprimir 
una respuesta no, 

Este diagrama de flujo ilustra las operaciones paso por paso en la realización de 
h tarea, y le atribuye cargas temporales a las diversas operaciones (lo cual explica 
la frecuente instrucción para poner el nuevo RT igual al antiguo RT más alguna 
constante). Este programa ejemplifica lo que se denomina una búsqueda serial de 
aytoterminación. Es serial en el sentido de que los elernentos de la lista se recupe- 
ran y se comparan con el sondeo en serie, uno por uno, en vez de hacerlo simul- 
táneamente (en paralelo, o todos a la vez). Es de «stoterminación porque el 
proceso se detiene (sale del circuito de exploración) tan pronto como obtiene un 
compañero para el estímulo del sondeo, en lugar de explorar de forma exhaustiva 
hasta el final de la lista, independientermente de si antes se consiguió una iguala- 
ción. Si suponemos una distribución aleatoria (uniforme) de localizaciones positi- 
vas de sondeos dentro de la lista, la localización promedio se encontraría en (N 
+ 1)/2 en una lista de longitud N. Con una búsqueda de autoterminación, esta (N + 
1)/2 será entonces el mimero promedio de operaciones de traer y comparar lleya- 
das a caho en ensayos probatorios positivos. Las ecuaciones implicadas para los 
tiempos promedio de reacción con sondeo positivo (sí) y sondeo negativo (10) se- 
rían las siguientes: 
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Cargar M1), 4(2), - 20M) 


Comp, A=0, Son]. ¿=1 
E E 


LESA) + sonar | 


Si —. [Conj. AT=ATSC 
rprimbr sl 


Circuito 


Figura 12.2. Diagrama de flu- 
jo que describe un modelo de 
simulación para predecir los 
tiempos de reacción en la ta- 
rea de “búsqueda de memo- 
ria”, de Sternberg. El sujeto ha 
de decidir si un reactivo de 
sondeo dado es o no miembro 
de un conjunto prescrito de 
reactivos en la memoria, 
designados como x(1), x(2),..., 


x(N) 
rr60 rro PD y 
= LAN 4 y e 
y 


RTM) = (1 ++ ON + h, 140) 


En cada caso, se espera que los tiempos de reacción se incrementen como una 
línea recta (o proporcionalmente) a medida que aumenta la longitud N de la lista. 
Con el modelo programado en la figura 12.2 se espera que la inclinación de la línea 
no (el coeficiente que multiplica A) sea exactamente el doble que la inclinación de 
la línea sí. 
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Estes son predicciones muy definitivas del modelo de proceso de la figura 12.2. 
Aunque sirven para ilustrar el enfoque, las predicciones particulares acerca de las 
inclinaciones no siempre son correctas. Más bien, los datos reales (véase Stern- 
berg, 1969) a menudo muestran inclinaciones ¿guales para las líneas de sí y no. 
Esto podría producirse mediante un modelo que explore exhaustivamente la totali- 
dad de los reactivos del conjunto de memoria antes de dar la respuesta. Para ello 
sería necesario modificar el programa que se ilustra en el diagrama de la figura 
12.2, de modo que recuerde cualquier igualación encontrada en su exploración, 
pero que de todas formas concluya la exploración de la lista antes de responder sf, 
Sternberg propone esencialmente este modelo para sus datos; muchos experi- 
mentos se han concentrado en esta tarea de búsqueda de memoria y en estos ti- 
pos de modelo. 


Subrutinas y jerarquías de tarea 


Ahora bien, a partir de las enunciaciones iniciales, al programa completo de la (- 
gura 12.2, se le podría denominar SCANLIST y tratarlo entonces como una sb- 
rutina unitaria para incrustarlo dentro de cualquier programa más grande que re- 
quiera de esa función, Además, x(1) también podrían ser los nombres de listas 
completas de símbolos, en vez de elementos aislados; entonces, una instrucción 
como '*para ] = la K SCANLIST x (1)””, resultaría esencialmente en K llamadas 
sucesivas para la subrutina de la figura 12.2, verificando las diferentes listas para 
un sondeo especificado. El punto importante consiste en ver que SCANLIST se 
ha convertido en una rutina automática que puede emplearse repetidas veces 
como proceso componente para resolver otros problemas. Este proceso completo 
—hacer que un programa sea un componente incrustado dentro de un programa 
más amplio que incluso puede estar incrustado dentro de otro mayor— es de natu- 
raleza jerárquica. Al observar las cosas “desde arriba”', a fin de elaborar el pro- 
grama (''trabajo””) 4, hacemos entrar a la subrutina BA; pero B puede hacer entrar 
a la subrutina C, etc., hasta que se encuentren instrucciones simples. Una vez 
gue C **termina su asignación de trabajo””, regresa sus resultados a B, que enton- 
ces podrá hacer algunas operaciones (por ejemplo, comparar resultados de varias 
subrutinas) antes de pasarle sus resultados a A, que es el programa ejecutivo de 
nivel superior que controla o supervisa toda la jerarquía. Este programa jerárquico 
es parecido a la forma de control y asignación laboral dentro de una empresa o una 
organización gubernamental. 

En ha figura 12.3 se muestra un esquema de jerarquía de tres niveles en un pro- 
grama de solución de problemas o de asignación laboral. Por ejemplo. supóngase 
que el lector quiere asistir a un concierto o a otro evento público (meta A). Para 
hacerlo, tiene que comprar boletos (submeta B) y llegar a la sala de conciertos a la 
hora señalada (submeta C), Para adquirir los boletos dehe extender un cheque y 
escribir una carta (submeta D), y mandarlos por correo a la oficina de boletos 
(submeta £). Cuando tenga los boletos, debe llegar a la sala de conciertos a la 
hora adecuada. Se viste y se prepara para salir de su casa a la hora indicada (sub- 
meta F), camina o conduce su automóvil hasta la sala de conciertos (submeta G), 
entra y ocupa su butaca a tiempo (submeta /4). Al terminar la submeta H, el lector 
habrá cumplido simultáneamente la siguiente submeta superior C (llegar a la sala 
de conciertos a tiempo), y se ha colocado en posición de satisfacer la meta supe- 
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Conseguir mete 
2 t 
Alcanzer meto A siguiente 


Figura 12.3. Representación esquemática de un programa jerárquico de tres niveles, 
en el que la consecución de metas particulares depende del logro de un grupo de 
submetas, lo cual significa llevas a cabo un conjunto de actividades componentes. 
Las flechas indican la dirección en la que la información y el control pasan por el sis- 
tema. 


rior A (escuchar el concierto). Una vez que eso ha concluido, la meta siguiente se 
carga en el procesador para ser realizada; por ejemplo, encontrar una cafetería 
para tomar un refrigerio después del concierto. 

Los diagramas como el de la figura 12.3 tienen un natural atractivo pata los psi 
cólogos interesados en analizar la conducta en sus componentes y en su organi- 
zación. Las submetas y las actividades pueden descomponerse en detalles tan di- 
minutos como el científico desee, pero la ““Jocalización” de un componente dado 
puede verse en términos de dónde encaja y cómo funciona en la organización total 
de la ejecución. La interpretación de las flechas en la figura 12.3 y la dirección de 
los mismas es importante, puesto que indican la dirección del flujo de contro! del 
procesador central de las diversas actividades. En términos generales, las flechas 
imitan al cerebro que cambia su '“atención”” y su esfuerzo de procesamiento pata 
la actividad ubicada en la punta de la flecha. Este análisis jerárquico de las tareas 
psicológicas se deriva directamente de los conceptos de programas jerárquicos de 
computadora, y fue introducido en la psicología por Simon, Newell y otros cien- 
tíficos que trabajaban en la simulación por computadora. Una descripción accesible 
de estas ideas y una exposición de su utilidad para la teoría psicológica se encuen 
tra en Plans and the structure of behavior, de G. A. Miller, Galanter y Pribram 
(1960). 

Volviendo al programa SCANLIST de la figura 12.2 para la tarea de Stermberg, 
debe notarse que la computadora se emplea como un dispositivo de manipulación 
de símbolos y como un calculador numérico. Por ejemplo, busca y compara dos 
símbolos para una igualación, y también suma incrementos al contador del tiempo 
de reacción. De hecho, dentro de la bibliografía PJ, las computadoras se conciben 
fundamentalmente como dispositivos de manipulación de símbolos de propósito 
general. Como reflejo de este punto de vista se han desarrollado varios lenguajes 
de procesamiento de lista que sirven de convenientes vehículos a la formulación y 
expresión de ideas PI en los programas de computadora. Entre los diversos len- 
guajes asequibles de procesamiento en lista, el LISP es el más utilizado en el tra- 
bajo PI actual, 

Para ilustrar uno de estos lenguajes, los objetos básicos del LISP son átomos 
(simbolos), y “S-expresstoms””, que son listas entre paréntesis de símbolos o nom- 
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bres de listas de símbolos. Las operaciones que el LISP ejecuta incluyen: agregar 
o quitar una palabra de una lista particular, volver a mezclar varias de ellas, combi- 
nar dos listas en una, nombrar una lista, examinar las palabras de una lista para en- 
contrar las que sean iguales, describir las propiedades de una lista y vincularlas 
con la primera, borrar o copiar una lista, etcétera. Estos procesos básicos supues- 
tamente forman un lenguaje natural para los programas PI. En sí, estas opera- 
ciones a pequeña escala no parecen adjudicar ninguna inteligencia a la maquinaria 
básica que las ejecuta. Sin embargo, cuando se vierten decenas de miles de tales 
operaciones en un programa organizado, las características netas de ejecución 
cambian cualitativamente y se transforman en conducta en verdad “'inteligente”', 
a menudo de una variedad que el diseñador del programa no había previsto. 


PROGRAMAS DE APRENDIZAJE SIMPLE 


La mayoría de los programas PI abordan las simulaciones de los problemas-so- 
lución complejos por medio de los humanos adultos, pero no tratan, en ninguna 
forma sistemática, con las simulaciones de las situaciones de condicionamiento. 
Esto se debe, en parte, a que el mayor interés de los autores radica en creer que 
la simulación del condicionamiento simple no destaca lo suficiente las ventajas de la 
teoría de la simulación. No obstante, consideraremos brevemente algunos ejem- 
plos de los modelos de simulación de computadora del condicionamiento simple. 


Condicionamiento pavioviano 

Elaboremos un modelo de simufación simple de condicionamiento pavloviano, a 
fin de ilustrar algunos puntos. Primero, almacenemos una lista de reflejos innatos, 
en la memoria de la computadora, especificando cómo los estímulos incondiciona- 
dos (£)) producen una respuesta particular incondicionada (RI). Cuando uno de 
éstos se use en un experimento pavloviano, adjuntaremos al reflejo un número 
entre 0 y 1, Para un El de alimento, este número aumentará según el estado de 
privación del alimento (hambre) del animal y la cantidad del alimento dado como 
estímulo incondicionado (ED. 

Segundo, representemos otro estímulo (neutral) como los símbolos alfabéticos 
4, B, C,..., de modo que durante el tiempo y los múltiples ensayos en un experi- 
mento de condicionamiento, la secuencia de símbolos pueda ser A, €, EL-RI, B, 
D, C, EERI, E, F, C, ELRI, B, X, C, El-RI. Requeriremos de un dispositivo 
mecánico, a fin de revisar tales secuencias e inferir cuál estímulo predice con se- 
guridad el evento ET-RT. Desde luego, éste es el problema prototípico de induc- 
ción para detectar regularidades o relaciones entre eventos en una sucesión de 
entrada. En la secuencia ilustrada, C está señalada para preceder en forma regular 
la ocurrencia de E7-RT, de tal manera que probablemente corresponda al estímulo 
condicionado (EC) que el experimentador disponga para preceder al E7. Los res- 
tantes estímulos fluctúan de modo no confiable entre los ensayos con el EC y el 
El. Pero ¿cómo infirió usted que C regularmente precede al Ef? ¿Mediante qué 
regla o mecanismo? Recuérdese que el organismo experimenta los sucesos uno 
por uno, dispuestos en el transcurso del tiempo, y no tiene un registro visual 
como hemos descrito aquí. 

Una regla simple consiste en hacer que el organismo inspeccione cada símbolo 
de entrada y tabule cuáles lo precedían y lo seguían inmediatamente en la secuen- 
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cia. Tal tabulación revelaría que el símbolo C va seguido regularmente del EL-RI 
y, de forma similar, que el Ef-RÍ va precedido con regularidad por el símbolo C. 

También necesitamos una regla simple para la ejecución, que es ésta: conforme 
ocurre cada símbolo de estímulo, buscamos en la mernoría la tabulación de sus su- 
cesores; si ha precedido regularmente al mismo suceso EJ-RT, entonces la com- 
putadora imprime que RJ es una “respuesta anticipatoria”” a ese símbolo; en caso 
contrario, no imprime nada. La R] anticipatoria sería análoga a la respuesta condi- 
cionada en el modelo de simulación. 

Para inducir curvas realistas del aprendizaje, necesitaríamos una medición conti- 
nua de la “fuerza” de la asociación condicionada desde el EC neutral hasta la RI. 
Una posible regla del aprendizaje sería: para cada ensayo, incremente la fuerza de 
la conexión EC-El por una fracción de la diferencia existente entre la fuerza actual 
de la conexión y la fuerza del EJ-R7 que se mide. Mediante la elección apropiada 
de la fracción de incremento, podrían generarse las curvas estándar del condi- 
cionamiento y la extinción de Pavlov. 

Aunque ese sistema de aprendizaje artificial simularía el condicionamiento pavlo- 
viano en circunstancias estándar, el objetivo de la teoría es proponer un sistema 
que pronostique resultados obtenidos en múltiples situaciones de condiciona- 
miento. En este aspecto, el modelo de aprendizaje descrito revela con rapidez sus 
desventajas. Por ejemplo, como está enunciado, no aprenderá si el EC predictivo 
ocurre dos o más intervalos temporales (o símbolos) antes del E7. No tiene en 
cuenta la intensidad del EC, ni la discriminabilidad del EC respecto a los estímulos 
de fondo en la situación. Tampoco explica que el condicionamiento de EC, avance 
con más lentitud si sus ensayos se alternan con aquellos de un EC, que está aso- 
ciándose con el mismo Ef. Cada uno de esos resultados no predichos sugiere la 
necesidad de una revisión del modelo original; se espera que tales revisiones dís- 
minuyan a medida que se consideren y expliquen más resultados. De fracasar, se 
descartaría el modelo original para comenzar desde el principio. No revisaremos 
nuestro modelo patrón, ya que ha cumplido con su propósito. 


Aprendizaje de ensayo y error 

Es fácil construir un modelo de simulación simple para el aprendizaje de ensayo 
y error. Se concibe que, para una situación dada de estímulo, el organismo tiene 
un repertorio de respuestas, denominadas R,, R,,... R,. Muchas veces resulta 
conveniente definir una de estas clases de respuesta por exclusión; es decir, R, es 
“cualquier otra cosa'” que no sean las respuestas de interés central. Cada res- 
puesta £?, para un estímulo ha almacenado en su interior una fuerza, V,, que deter- 
mina la probabilidad de su elección en ese ensayo, según la siguiente fórmula: 


D= VIV, + Ve + + Y, (2) 


En cada ensayo se selecciona una respuesta mediante el uso de una tabla de nú- 
meros aleatorios, de modo que la respuesta R, se seleccionará con probabilidad f; 
en ese ensayo. Si se presenta una respuesta y es reforzada, su fuerza se incre- 
Taenta al multiplicaria por un factor de recompensa $, que es mayor que uno y de- 
pende del valor del reforzador. Si una respuesta ocurre y no es reforzada, su fuer- 
za disminuye al multiplicarla por un factor de no recompensa $,, que es menor que 
uno, pero mayor que cero. (Estas son las premisas del modelo del aprendizaje de 
fuerza de respuesta, de Luce, 1959.) 
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Si a tal sistema se le dan ensayos múltiples con KR, reforzada y las ot: as respues- 
tas no reforzadas, muy pronto se entrenará a sí mismo para elegir invariablemente 
R,. Al haber demostrado que el modelo puede aprender en algunas circunstancias 
estándar, pasaríamos a comprobarlo variando el experimento a ún de verificar pre- 
misas críticas, Por ejemplo, ¿cómo manejaría el reforzamiento parcial, el aprendi- 
zaje de probabilidad o la elección entre diferentes cantidades de recompensa? El 
buscar las respuestas a estas preguntas es lo que constituye el juego explicativo. 


Elementos de un sistema de aprendizaje 


Aun estos sistemas simples de aprendizaje poseen varias partes distintivas, que 
se describen en la figura 12.4, El modeto de sujeto opera en algún ambiente de ta- 
rea, como un laberinto. Tal ambiente de tarea tiene ciertos objetos y define ciertas 
acciones y contingencias de reforzamiento. Sus aspectos relevantes suelen repre - 
sentarse en la memoria del sujeto, El selector de casos es cualquier procedimiento 
que haga que diferentes casos o ensayos de la tarea se le presenten repetidas ve- 
ces al sujeto. En el experimento típico de laboratorio esto está bajo el control del 
investigador, y a menudo es trivial; por ejemplo, el experimentador presenta alea- 
toriamente los patrones de estímulo para clasificar. En algunas circunstancias, el 
propio aprendiz puede seleccionar los casos de una manera sofisticada a fin de ele- 
var al máximo su rapidez de aprendizaje, El elemento de ejecución que aparece en 
la figura 12.4 es responsable de producir alguna respuesta del sistema a cada nue- 
vo estímulo o caso, El exítico analiza la respuesta del elemento de ejecución en 
comparación con algún estándar de logro: evalúa la suficiencia de la ejecución, 
puede localizar la causa de los errores y está en posibilidad de recomendar recti- 
ficaciones para mejorar las ejecuciones siguientes, El elemento de aprendizaje tra- 
duce las recomendaciones del crítico en cambios específicos en los parámetros o 
reglas usados por el elemento de ejecución. La información de la tarea y el apren- 
dizaje del sujeto se suelen representar de alguna manera en la memoria de opera- 
ción, y el aprendizaje consiste en alterar el conocimiento que tiene el sujeto acerca 
de la ejecución requerida en el ambiente de tarea, La memoria de operación es el 
medio por el cual los diversos elementos comunican sus resultados unos a otros, y 
contiene el conocimiento pasado y el conocimiento nuevo que emerge. 

Estos componentes se ide atifican con facilidad en nuestro modelo elemental de 
aprendizaje por ensayo y error. El ambiente de tarea podría ser el laberinto 7; las 
elecciones, izquierda y derecha, y la regla, que las izquierdas se recompensan, El 
selector de caso sencillamente coloca al sujeto en la misma situación de elección 


El ambiente de la tarea 
Figura 12.4. Los cuatro compo- 
nentes de un sistema de apren- 


Elamento de Elemento de 
ejecución aprendizaje 
dizaje que se adapta a un am- 
Memoria de biente de tarea (adaptada de Bu- 
selecio funciona: Crtica | chanan, Mitchell, Smith y John- 
mianto son, 1973). 
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en cada ensayo, aquí representada en términos de entrada de un símbolo simple. 
El elemento de ejecución selecciona una respuesta izquierda o derecha mediante 
la conversión de las fuerzas relativas de las respuestas en probabilidades, y las es- 
coge al generar un número aleatorio. El crítico observa si la respuesta fue o no re- 
compensada, y recomienda incrementar su fuerza si fue recompensada, y dismi- 
núirla si no lo fue. El elemento de aprendizaje computa los cambios en la fuerza de 
acuerdo con el consejo. Diferentes sistemas de aprendizaje manejan estas funcio- 
nes de distintas formas, algunas de las cuales se dan tan automática nente que casi 
no son dignas de mención. Los elementos proporcionan una estructura convenien- 
te para organizar y comparar diferentes sistemas de aprendizaje, sin importar 
cuán complejo sea el ambiente de tarea en el que operan. 


Desarrollos iniciales 


Los años comprendidos entre 1953 y 1960 marcan el comienzo de los modernos 
modelos del procesamiento de información. Al inicio de este periodo, Newell, 
Shaw y Simon (1958) Newell y Simon (1956) empezaron su trabajo sobre el 
**teórico lógico””, un programa para simular la manera en que un estudiante com- 
prueba teoremas en la lógica simbólica. Al mismo tiempo, un grupo de científicos 
del Massachusetts Institute of Technology trabajaba sobre el reconocimiento auto- 
mático de patrones. En el Camegie Mellon-MIT-Stanford University se trabajó 
conjuntamente y se intercambiaron ideas y técnicas durante este periodo de for- 
mación. 

Desde aquella época ha existido una rápida proliferación de programas sobre 
modelos que ejecutan gran variedad de tareas inteligentes. Minsky proporciona 
una primera reseña (1961), y también hay una colección de artículos fundamen- 
tales editados por Feigenbaum y Feldman (1963). Este capítulo es necesarlamen- 
te una revisión limitada de lo que sucede en este campo de rápida expansión. 
Seleccionamos para su discusión algunos de los trabajos sobre modelos para el re- 
conocimiento de patrón (aprendizaje perceptual), solución de problemas y apren- 
dizaje, Cada uno de los sistemas que examinaremos es un conjunto muy amplio y 
complejo de instrucciones detalladas en un programa de funcionamiento. Esto sig- 
nifica que una breve descripción sólo puede tocar los puntos sobresalientes de lo 
que hace un modelo particular y explicar, en términos generales, cómo logra su 
objetivo. 

Una clasificación conveniente —aunque a menudo indefinido — de los modelos 
PI los divide en aquellos que tratan con la simulación psicológica y los que tratan 
con la inteligencia artificial. La distinción apunta principalmente a la intención ex- 
presada por el teórico: si su objetivo es que el modelo copie paso por paso los pro- 
cesos que cree que una persona realiza para ejecutar una tarea, se dedica a la si- 
mulación de la conducta humana; si su propósito es diseñar un programa eficiente 
que ejecute alguna tarea compleja, independientemente de cómo lo haria una per- 
sona, entonces se abocará a una investigación de inteligencia artificial, Una com- 
putadora ligada a un radar que calcula la trayectoria de un proyectil que se aproxi- 
ma y dispara un contraproyectil para detonar al primero, es un ejemplo de máquina 
con inteligencia artificial. Lo que aquí se requiere es que la máquina supera la eje- 
cución del ser humano, no que simule con exactitud la conducta. Esta distinción 
entre las dos áreas de investigación no siempre está bien delimitada, y los princi- 
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pios que se aplican en la construcción de un autómata eficiente por lo común son 
dignos de estudio, aunque sólo sea para ver dónde y cómo se queda corto el ser 
hutnano. Asimismo, los principios incorporados a un programa artificialmente inte- 
ligente para solucionar problemas en muchas ocasiones se derivan de la obser- 
vación e introspección de cómo los resuelve el hombre. El es, con mucho, el solu- 
cionador de problemas más versátil que existe sobre la Tierra, de modo que un 
modelo humano es casi siempre un buen punto a partir del cual comenzar a diseñar 
un autómata artificialmente inteligente. El problema de la simulación se ilustra de 
forma conveniente al considerar el reconocimiento de patrón, 


RECONOCIMIENTO DE PATRÓN 


Una pregunta central es cómo construir un modelo o programar una máquina 
que muestre algunas de las capacidades humanas para clasificar y discriminar el 
flujo de energías ambientales que bombardean los sentidos. Una de las habilidades 
básicas es la clasificación de unidades aisladas de entrada, Clasificar consiste en 
separar una serie de cosas en clases, o lo que se denomina bins, Cada bin tiene un 
nombre, y todas Jas cosas clasificadas dentro de un determinado bin reciben ese 
nombre. El din es una clase de *“equivalencia”; las cosas incluidas en él deben po- 
seer una o más características en común, que constituyen los criterios para la 
equivalencia, aunque a] mismo tiempo puedan diferir en un cierto número de as- 
pectos sin importancia para la presente clasificación. Por ejemplo, al identificar le- 
tras impresas y escritas del alfabeto, un niño en la escuela primaria aprende a dar 
un nombre, “44”, a todos los objetos de la figura 12.5, Después del aprendizaje 
perceptual, la etiqueta de identificación es imvarante en una diversidad de trans- 
formaciones en tamaño, forma, orientación y alteración por indicios extraños en el 
estímulo externo. El problema consiste en lograr que una máquina haga el mismo 
trabajo de clasificar estas entradas con tanta eficiencia como lo haría un niño corm- 
petente y cuidadoso. 

En un sentido trivial, el problema del reconocimiento de patrón se resuelve si 
los objetos de estímulo se reduce a un formato constante y estandarizado antes de 
que se le den a la máquina. Por ejemplo, las máquinas comerciales usualmente 
“leen” caracteres alfanuméricos (las letras del alfabeto y los números del 0 al 9) 
mediante el proceso de exploración que realiza una fotocelda, El explorador lee un 
carácter comparando la entrada estandarizada con uno de cierto número de planti- 
llas o prototipos de caracteres que están almacenados. La entrada se identifica 
con la plantilla que mejor la iguale. Pero la entrada a tales dispositivos debe impri- 


bl ] a Á * 1 5 Figura 12.5. Muestra de variacio- 
nes en letra manuscrita de A 
A A mayúscula. El problema consiste 

A ” , $ s ” 


en programar una máquina que 
descarte las variaciones no perti- 


aan al A AS a nentes, e identifique en todos 
1 s s 1 E esos patrones a la letra A. 
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mirse con un tipo cuya orientación, tamaño y ubicación permanezcan fijos. Estas 
máquinas sensibles son prácticas en los bancos (lectura de cheques, número de 
cuentas, etc.), en empresas comerciales y en las oficinas de correos (para clasi- 
ficar la correspondencia). Sin embargo, casi no poseen significación como solucio- 
nes para el problema de la invariancia que se ha mencionado, 

Un primer paso para solucionar el problema de la invariancia consiste en escribir 
un programa que realice algún tipo de limpieza y preprocesamiento de la entrada 
de estímulo, antes de alimentar el mecanismo de decisión del reconocedor de pa- 
trón. Un procesamiento tan burdo puede suavizar las irregularidades locales, tle- 
nar pequeños vacíos, hacer a un lado rasgos excesivos, centrar al estímulo en el 
lugar en que se va a recibir la muestra, cambiarlo a una orientación y tamaño es- 
tandarizados, etcétera. Después del preprocesamiento, podríamos aplicar el mé- 
todo de la igualación de plantillas para determinar si el sistema es capaz de identi- 
ficar correctamente la totalidad de los estímulos. En la figura 12.6 se muestra este 
método y se ilustra una de sus principales desventajas. La dificultad es que incluso 
después del preprocesamiento, una muestra de entrada todavía puede igualar 
mejor a una planilla equivocada que a la correcta, En la figura 12,6b, por ejemplo, 
la plantilla 4 produce incorrectamente una mejor igualación a la muestra R de en- 
trada que las otras dos muestras A. 

Un enfoque alternativo es complementar el preprocesamiento con una variedad de 
otros procedimientos extractores de información, que podrían denominarse conta- 
dores de características, por ejemplo, una A mayúscula por lo común tiene dos lí- 
neas casi verticales, y una línea casi siempre horizontal; generalmente es cóncava 
en la parte inferior, etcétera. Esas características aunadas identifican a A más que 
a cualquier otro elemento. La lista de características proporciona un perfil estan- 
darizado de una entrada, y a partir de él pueden tomarse decisiones. El número y 
la naturaleza de esas características usualmente son estipulados con antelación 
por el constructor del modelo. De cualquier manera, es importante notar que aca- 


ía) A A 
Figura 12.6. a) La equivalencia de la letra desco- 
nocida (negra) con la plantilla (gris) no ocurrirá si 
aquélla es distinta en tamaño, orientación o posi- 
ción. El programa debe empezar por ajustar la 
muestra al tamaño estándar y orientación, como 
se muestra hacia la derecha. (b) La equivalencia 


incorrecta puede tener lugar cuando la muestra 


(b) 
(negra) se ha convertido a tamaño y orientación 
estándares. Aqui, la letra de muestra R se iguala 
con la plantilla de A más estrechamente que las 
demás muestras de A (tomada de Selfridge y 
Neisser, 1960), 
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bamos de bajar de nivel en los problemas con las plantillas, ya que ahora presupo- 
nemos plantillas para características, 

Dado un perfil de características del estímulo, pueden emplearse dos esquemas 
generales decidir cómo clasificarlo: un procesador serial y un procesador paralelo. 
Para ilustrar el procesador serial, emplearemos un ejemplo de Selfridge y Neisser 
(1960): 


.. Mn programa para distinguir las letras A, A, V y Y (véase fig. 12.7) podría decidir en- 
tre ellas con base en la presencia o ausencia de tres características; una concavidad en la 
parte superior, una barra cruzada y una línea vertical. El proceso de secuencia 
preguntaría primero: “¿hay una concavidad arriba?"' Si no la hay, la letra es la A; si la hay, 
entonces: ''¿hay una barra cruzada?”” Si la hay, la letra es la H1; si no la hay, entonces: 
** ¿hay una línea vertical?”” Sila hay, la letra es la Y; sino, es V (pág. 245). 


Un procesador serial de este tipo (denominado árbol de clasificación) es muy efi- 
ciente si la decisión en cada nodo (pregunta) del árbol resulta casi seguramente 


l. ¿Concavidad en la 
parte de erriba? 


Si ¿Barra cruzada? 


3 ¿Línea vertical? 


Figura 12.7. Programa de procesamiento secuencial para distinguir cuatro letras: A, 
H, Y, e Y. Emplea tres rasgos de prueba: presencia o ausencia de concavidad en la 
parte de arriba. una barra cruzada y una línea vertical. Las pruebas se aplican en or- 
den, y cada resultado determina el paso siguiente [tomada de Selfridge y Neisser, 
1960). 
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correcta.! Pero considérese su comportamiento cuando los datos de entrada son rui- 
dosos (imprecisos), y cada identificador de características es poco confiable e in- 
cierto en su salida, Si una característica se identifica incorrectamente, el estímulo 
será derivado de modo incorrecto a lo largo del árbol de clasificación, y las carac- 
terísticas subsecuentes que sean identificadas de forma correcta tal vez no basten 
para compensar la mala identificación de las primeras, Este procesador serial de- 
pende mucho de lo correcto de la identificación en cada característica aislada: cual- 
quier característica lo compromete demasiado con una decisión particular. Proba- 
blemente, un mejor proceso de decisión sería el que combine toda la información 
de características de manera simultánea; la combinación de muchos componentes 
no confiables puede producir un sistema total cuya confiabilidad exceda en mucho 
a la de cualquiera de sus partes constituyentes. La mayoría de los procesadores 
en paralelo hacen exactamente esto, mientras que un procesador serial debe estar 
equipado con pruebas redundantes de multiplicación para lograr un resultado similar. 
En el procesamiento paralelo todas las preguntas se formulan al mismo tiempo, 
y la totalidad de las respuestas puede presentarse de modo simultáneo a la perso- 
na que tome la decisión (véase la figura 12.8). Diferentes combinaciones identifi- 
can a las distintas letras. Podría pensarse que las diversas características son ins- 
peccionadas por pequeños demonios, todos los cuales gritan las respuestas en concierto 
a otro demonio, que toma la decisión. De este concierto se deriva el nombre de 
pandemonium aplicado al procesamiento en paralelo (Selfridge y Neisser. 1980). 
Un procesador de esta naturaleza depende mucho menos de la confiabilidad de los 
detectores separados de características. La combinación de muchos componentes 
poco confiables puede dar una ejecución global confiable. Además, un aspecto im- 
portante del procesador en paralelo es que las características que contribuyen a un 
patrón particular son sopesadas diferencialmente, con ““amplificadores'* que de- 
terminan cuán alto deben gritar los demonios de las características. Ese sope- 
samiento diferencial de las características de acuerdo con su importancia no puede 
hacerse con el procesador serial. Por ejemplo, usando el procesador paralelo, el 
peso de la característica ““concavidad arriba” del patrón A podría ajustarse para 
que su ausencia fuera tres veces más importante que la ausencia de la caracterís- 
tica de “línea vertical””. Estos pesos se ajustan con la experiencia de modo pare- 
cido al método de ensayo y error, hasta que se logra una combinación de máxima 
efectividad, de las características sopesadas. Las características que únicamente 
sugieren la respuesta correcta se aumentan en peso, mientras que las que sugie- 
ren errores o respuestas aleatorias se disminuyen en peso. Un esquema alterna- 
tivo se basa en la acumulación de un gran registro de patrones pasados; el peso 
asignado a una característica dada, al calcular su contribución, por ejemplo, ala hú- 
pótesis del patrón A, es la probabilidad de que, en casos pasados, la respuesta co- 
rrecta fuera Á cuando aparecía esa característica. Se toma la suma de las proba- 
bilidades de las características que contribuyen a cada patrón, y se escoge como 
identificación de la entrada el nombre del patrón que tiene la suma mayor. 


lUna inspección cuidadosa demuestra que Selfridge y Neisser proporcionan una ilustración que no 
emplea las características de la manera más eficaz. Un árbol eficiente pregunta en primer término por 
la presencia de una barra cruzada, que produce los pares (H, A) y (Y, Y), y después por la de una línea 
vertical, que discrimina los elementos dentro de cada par. Del árbol que aparece en la figura 12.7 se 
diría que contiene una característica redundante. 
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1. ¿Concavidad en la 
parta da arriba? 


2. ¿Barra cruzada? . 


DA MEN ONO 


08) NO 000 MON 
| 
[] 
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3. ¿Unaa vartical? 
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| 
O 


Figura 12.8. E) programa de nrocesamiento en paralelo utiliza la misma prueba de 
rasgos que el programa secuencial de la figura 12.7, pero aplica todas las pruebas si- 
mul)táneamente y toma decisiones con base en los resultados combinados. La entra- 
da es una muestra de las letras [tomada de Selíridge y Neisser, 1960) 


Desde mediados de la década de los cincuenta se han construido centenares de 
programas de reconocimiento de patrón en diversos dominios de estímulo para pa- 
trones discriminativos. Las tareas incluyen la discriminación de muchas varieda- 
des de objetos visuales aislados, como cartas manuscritas, rostros, bocetos de 
objetos comunes y transparencias histológicas de tejidos cancerosos y no cance- 
rosos. Los modelos se desempeñan con diversos grados de eficacia, lo cual 
depende de la dificultad del conjunto de patrones a ser discriminados y de asequi- 
bilidad de características de estímulo que sirvan para distinguirlos. Muchos pro- 
gramas (por ejemplo, Uhr y Vossler, 1963) incluso desarrollan sus propias ca- 
racterísticas críticas de los estímulos. AJ generar nuevas características y evaluar 
su poder discriminativo, los modelos demuestran una forma de aprendizaje percep- 
tual; llegan a notar aspectos discriminativos de los estímulos que inclusive el dise- 
ñador del sistema ha pasado por alto. También se han ideado modelos para tratar con 
el reconocimiento de palabras orales; por ejemplo, los números cero al nueve pro- 
nunciados por diferentes personas. En este segundo caso, la entrada del progra- 
ma es una representación digitalizada del espectograma del habla, que momento a 
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momento da una resolución de un sonido oral complejo en forma de amplitudes de 
varios componentes de frecuencia. 

La mayor parte de las investigaciones acerca del reconocimiento de patrón se 
han dedicado a resolver la tarea de criterio de discriminación de los patrones, y no 
de simular la manera en que un organismo ejecuta la tarea. Mustraremos dos teo- 
rías del aprendizaje de patrón. El hecho de que los diseñadores comprobaran es- 
tas teorías al compararlas con datos provenientes de experimentos psicológicos 
atestigua su interés por la validez psicológica. 


El perceptor y memorizador elemental (PYME) 


El perceptor y memorizador elemental (PYME) es un modelo de reconocimien- 
to de patrón elaborado por E. A. Feigenbaum y H. A. Simon, cuyo objetivo era 
desarrollar un modelo que simulara la conducta humana en una variedad de tareas 
de discriminación que implican aprendizaje asociativo. Entre estas tareas se in- 
cluían el aprendizaje de pares asociados, aprendizaje de reconocimiento, aprendi- 
zaje serial de rutina, tareas de memoria inmediata o de corto plazo, aprendizaie de 
la lectura de un texto, de nombrar objetos o cuadros, de formar conceptos, etcé- 
tera, En principio, los estímulos podrían suministrarse directamente a la máquina 
de forma visual o auditiva. Sin embargo, la versión actual del PYME no tiene pro- 
cesador perceptual, de modo que el programador debe analizar los estímulos en 
características distintivas, perforar esta información en tarjetas 7BM; sólo enton- 
ces el PYME será capaz de tratar con los “estímulos”, 

Debido a la amplitud de sus metas, el PYME es complicado y voluminoso. El 
modelo básico (Feigenbaum, 1959) ha sido objeto de muchas pruebas y modifica- 
ciones. La versión que expondremos a continuación se describe en un artículo 
de Simon y Feigenbaum (1964). Consideraremos su aplicación al aprendizaje de 
pares asociados. Supóngase específicamente que el modelo está aprendiendo una 
lista de pares de sílabas sin semido (REA-GIJ, RUZ-FOT, etc.). Una parte del 
programa simula la tarea experimental; es decir, imita un tambor de memoria que 
se mueve a ritmo fo y que primero expone un miembro de estímulo, después los 
miembros de estímulo y respuesta juntos, y repite cíclicamente todos los pares de 
la ústa. La tarea del modelo consiste en prever (imprimir) la respuesta correcta 
cuando se muestra el estímulo, 

El PYME aprende construyendo un árbol de clasificación o red de discrimina- 
ción que permite la diferenciación entre los estímulos y las respuestas. El árbol de 
clasificación es un sistema de procesamiento serial muy parecido al que aparece 
en la figura 12.7. En los nodos terminales de este árbol están almacenadas las 
*'imágenes”” compuestas, que son representaciones más o menos complejas de 
los pares E-R, En términos generales, ni las características usadas para clasificar 
ni la información almacenada en la imagen son completas; es decir, no se almacena 
más información que la mínima indispensable para la tarea del momento. 

Se postulan dos procesos de aprendizaje, construcción de imágenes (familiariza- 
ción) y aprendizaje discriminativo (crecimiento de árbol), Cuando un estímulo E a 
la vista se clasifica en un nodo terminal, se le compara con la imagen del estímulo 
E', que allí reside (por experiencia anterior). Si no hay ninguna imagen anterior, se 
copía una parte de £ como la imagen presente en ese nodo. Si ya hay allí una ima- 
gen, se lleva a cabo una comprobación entre E y E": si se detectan diferencias en 
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los detalles, se cambia o se aumenta E' para que se iguale a E. Así, es la imagen E' 
del crecimiento de E. Si se detecta una diferencia positiva (no sólo una divergencia 
en los detalles) entre E y E', se inicia el proceso de aprendizaje discriminativo y se 
construyen dos nuevas ramas que parten del nodo anterior terminal, como E y E”, 
que son, por separado, las imágenes de las nuevas terminales. A modo de ilustra- 
ción, supongamos que podemos alcanzar un nodo terminal coetáneo mediante 
pniebas de la primera letra R, y que la imagen coetánea en este nodo es R-H. A 
continuación, se clasifica RUZ en ese nodo. Al comparar RUZ con la imagen R-H, 
el programa nota una diferencia de detalle en la segunda posición (no serial) y una 
diferencia positiva (Z contra H) en la tercera posición. Aquí se impone una prueba 
de la tercera letra que se encuentra en este nodo, como puede observarse en la fi- 
gura 12.9, Con este nuevo nodo agregado al árbol, ya no se clasifican los estímulos 
REH y RUZ en el mismo nodo, y de esta manera se evitan las confusiones entre 
ellos. 

Aunque la clasificación (reconocimiento) se lleva a cabo sobre el miembro de es- 
tímulo del par, tanto las sílabas de estírmulo como las de respuesta se representan 
como una imagen compuesta E'-R” en el nodo terminal. La imagen de respuesta, 
R', se recupera cuando el E se clasifica y entra en contacto con la imagen del estí- 
mulo E'. La imagen de la respuesta R” contiene información que permite al pro- 
grama localizar otro nodo terminal R” en la red, y R”, después del aprendizaje, 
contendrá las imágenes de las tres letras de las sífabas de respuesta (G, 1, /), y la 
información necesaria para producirlas (mprimirlas). Es entonces cuando la pre- 
sentación del estímulo REH proveca que la máquina imprima G/f y que, por lo 
tanto, aprenda. 

Una virtud de este sistema es que trata a los términos nominales de estímulo y 
respuesta de forma comparable; es decir, como imágenes que deben construirse 
sobre el árbol de clasificación. Y el par E-R por asociarse tampoco requiere de una 
representación especial, en la medida en que simplemente es una imagen com- 
puesta y construida con dos imágenes simples. Además de los procesos de reco- 


Figura 12.9. Ejemplo de la forma en que se elaborará un nodo terminal primario de la 
red de discriminación PYMÉ, para diferenciar un estímulo previamente confuso. (2) 
Con las pruebas de la primera letra en R, se llega al nodo terminal que sustenta la 
imagen R-H. (b) Después, cuando RUZ se clasifica en este nodo. provocando un error 
de confusión, se agrega uha nueva prueba basada en la tercera letra y los dos nodos 
inferiores se ramifican a partir de esta terminal. 


460 Segunda parte. Teorías cognoscitivoorgani”acionales 


nocimiento y aprendizaje mencionados, el PYME tiene una rutina ejecutiva de alto 
nivel que supervisa y ““dinige la función”'. Parte de su labor consiste en mantener 
a los procesos centrales en contacto con el medio ambiente (por ejemplo, “dejar 
de procesar el último reactivo; responder al nuevo estímulo que acaba de presen- 
tarse en la ventana del tambor””); programar dónde y cuándo distribuirá el esfuer- 
zo y el tiempo de procesamiento a su disposición, ya que la construcción de imá- 
genes y el crecimiento de la red insumen tiempo a ese procesamiento. Utiliza 
retroalimentación acerca de su ejecución actual en un par £-R para decidir, en tér- 
minos generales, cuál es el problema y qué parte de la estructura de conocimiento 
necesita pulirse más. Estos macroprocesos ejecutivos son responsables de al- 
gunas de las predicciones más interesantes del PYME; por ejemplo, curvas de 
posición serial en el aprendizaje serial de rutina (Feigenbaum y Simon, 1962) y la 
explicación del efecto, sobre el aprendizaje serial, de la segmentación de la serie 
en grupos de diversos tamaños (Gregg, 1972). Hay muchos más detalles en re- 
lación con el PYME, pero en este bosquejo nos limitaremos a describir los proce- 
sos básicos que utiliza. 

Simon y Feigenbaum (1964) sometieron al modelo en cuestión a una diversidad 
de experimentos de aprendizaje simulado y los compararon con la salida de ensayo 
por ensayo que dan los seres humanos. Muestra varias similitudes con los datos. 
Como los seres humanos, el PYME necesita más tiempo para aprender una lista 
en la cual los reactivos de estímulo sean muy similares (muchas letras comunes). 
Muestra transferencia positiva o negativa en el aprendizaje de una segunda lista, 
conforme a las relaciones de estímulo-respuesta de las dos listas, del mismo modo 
que los datos humanos dependen de estas relaciones (véanse las revisiones de los 
trabajos acerca de la transferencia y la retención en el capítulo 6). Presenta tanm- 
bién los efectos benéficos de la previa familiarización con los términos de estímulo 
y respuesta antes de que éstos se empleen en una tarea de aprendizaje de pares 
asociados. El modelo comete errores por confusión del estímulo e interferencia 
retroactiva, en un grado que depende de la similitud de los reactivos de estímulo 
de la lista original aprendida y la interpolada, La simulación de los datos en ocasio- 
nes es muy exacta en un sentido cuantitativo relativo; es decir, la proporción de 
ensayos para aprender en la condición A respecto a los necesarios en la condición 
B es la misma en el modelo y en los seres humanos. En un artículo previo, Feigen- 
baum y Simon (1961) señalaron que el PYME mostraba una interesante forma de 
mediación (asociaciones encadenadas) que se puso de manifiesto en el entrena- 
miento de lectura. En la fase 1, el PYME aprendió a asociar las propiedades acús- 
ticamente codificadas de la palabra kahr con la ilustración codificada visualmente 
de un automóvil (car). En la fase 2, aprendió a asociar la palabra visual car con el 
patrón acústico rahr. Cuando se le probó posteriormente con la palabra visual car 
y se le pidió que señalara una ilustración, seleccionó la del automóvil. Este es un 
ejemplo simple de transferencia mediada, y pertenece al tipo elemental que predi- 
ría la mayoría de los análisis de estímulo-respuesta. 

Hintzman (1968) ha presentado una serie de modelos (llamados SAL por estí- 
rulo y aprendiz de asociación) basados en el desarrollo adaptativo de una red de 
discriminación, El modelo inicial (SAL-1), que simula el aprendizaje de pares aso- 
ciados, comienza esencialmente con las mismas premisas que el PYME, a excep- 
ción de que el crecimiento neto (“aprendizaje de nuevos discriminadores””) se 
considera un proceso probabilístico. A fin de ajustar los resultados experimenta- 
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les, Hintzman introdujo en el SAL otras tres premisas. Primero, se supone que in- 
cluso después de la maestría perfecta de un reactivo el programa puede aún 
aprender otros descriptores sobre él (es decir, el crecimiento de la red podría 
ocurrir tanto en ensayos de respuesta correcta como en ensayos de error). Esto 
permite a la teoría manejar una variedad de efectos como los del sobreaprendizaje, 
para reducir la interferencia retroactiva. Segundo, supuestamente la respuesta 
“'almacenada'* en el nodo terminal, para la cual se clasificaba un estímulo, podría 
ser una lista o grupo inferior (push-downx) de respuestas que han sido reforzadas a 
patrones de estímulo clasificados para esa terminal. La regla para colocar nuevas 
respuestas en este grupo inferior (tush-down) puede ilustrarse en lo que respecta 
al nodo terminal denotado R-H en la figura 12.9. Este nodo se logró sólo mediante 
pruebas sobre la primera letra, R. Supóngase que la respuesta Al está vinculada 
con esta terminal de estímulo. Un par posterior RUZ-A2 se clasificará a esta 
misma terminal y ocurrirá un error (41). Pero supongamos que en esta oca- 
sión no se aprende un nuevo discriminador; entonces el modelo SAL-7IF de 
Hintzman almacenaría la nueva respuesta 42 en la parte superior de un grupo 
mferior (push-dowm) vinculado al nodo terminal R-H (con el antiguo error Al co- 
locado en la segunda ranura del grupo). Esta premisa de una jerarquía de res- 
puesta ordenada temporalmente en terminales de estímulo “*confundidas”” tiene 
algunas implicaciones saludables que concuerdan con detalles de los experi- 
mentos de aprendizaje verbal (por ejemplo, el reconocimiento de par sufre una 
interferencia menor que el recuerdo de pares asociados). Una tercera premisa de 
SAL-IiT es que, en el transcurso del tiempo, las respuestas que residen en posi- 
ciones inferiores en un grupo inferior (push-dowx) “surgirán espontáneamente”, 
y al hacerlo ““expulsan”' a las respuestas más recientes y provocan que éstas se 
olviden. Esta premisa, afín a la noción de la recuperación espontánea de las asocia- 
ciones desaprendidas (véase el capítulo 6), permite al SAL explicar diversos he- 
chos importantes acerca de los cambios temporales en la interferencia proactiva y 
retroactiva durante un intervalo de retención. 

El trabajo de Hintzman es ejemplar, en la medida en que usa relativamente po- 
cas premisas, delimita con cuidado la extensión de fenómenos por explicar, y 
avanza sistemáticamente para explorar las consecuencias del modelo simulado en 
relación con un gran número de diferentes resultados experimentales. La conse- 
cuencia es tal vez uno de los ejemplos más impresionantes que poseemos de un 
modelo de simulación ajustado a una gran cantidad de resultados experimentales 
en el aprendizaje. Indudablemente, los modelos PYME y SAL no son teorías per- 
fectas ni completas, y se les ha criticado mucho (J, R. Anderson y Bower, 1973, 
capítulo 4); sin embargo, constituyen el tipo de modelos de los que um psicólogo 
teórico quisiera disponer para tratar de comprender la naturaleza del aprendizaje. 


Aprendices de conceptos 


Desde hace muchos años los psicólogos se han abncado a investigar el apren- 
dizaje de conceptos, y muchos de los trabajos iniciales se ubican dentro del marco 
de referencia de las tareas experimentales analizadas primeramente por Hovland 
(1952). Los objetos a patrones de estímulo se caracterizan de acuerdo con una 
lista de atributos, cada uno de los cuales posee un número determinado de va- 
lores. Por :* >... lo, los patrones geométricos pueden diferir en los atributos de ta- 
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maño, color, forma y orientación, entre otros. Si existen n atributos, cada uno de 
Jos cuales posee un valor de », potencialmente fiay entonces +” patrones de todos. 
Un concepto puede definirse como una división de ese conjunto en dos partes, en 
la que los patrones de una de ellas pertenecerían a la clase A, y los demás a la cla- 
se complementaria A. 

Para ilustrar este punto, consideremos que el universo de patrones consiste en 
cadenas de cuatro letras; en cada posición de letra (*'atributo'') puede aparecer 
cualesquiera de tres letras (*valores'”), Si los valores del atributo son (X, Z, T, 
(2, M, K), Y, W, R), y (B, 7, S), entonces XPJB y ZPRT son elementos de tal 
universo, mientras que XZT.P y XPTW no lo son. Para mayor comodidad, en ade- 
lante emplearemos abreviaturas como 3] para indicar la letra f en la posición 3, En 
el esquema inicial de Hovland, los conceptos se definen especificando un valor de 
atributo (por ejempla, 2K) o varios valores de atributo por medio de conjunciones 
lógicas entre ellos. En un problema confeetivo (por ejemplo, 14 y 2P), los patro- 
nes que contienen tanto a 1X como a 2P pertenecen a la clase A, de otra manera, 
pertenecen a la clase 4. En otras palabras, LX (como 2P) es necesaria por separa- 
do, pero no como condición suficiente para la clase A. Además de las citadas, se 
dispone de distintas variedades de conjunciones lógicas: disyunción exclusiva (2M 
o 4S, pero no ambas), implicación (45 o no 2M, o ambas), y bicondicional (LX y 
2P,ono1X y no2P). 

Siguiendo las nociones iniciales de Hunt y Hovland (1961), E. B, Hunt (1962), y 
Hunt, Marin y Stone (1966), desarrollaron un modelo de procesamiento de infor- 
mación que aprende o resuelve dichos problemas de conceptos. Aunque el modelo 
recurre a varias estrategias que los seres humanos también utilizan (por ejemplo, 
manifestar una disposición por las soluciones conjuntivas), contiene características 
que éstos no muestran (una memoria perfecta para muchos patrones previos, ra- 
cionalidad absoluta, cotejo sin errores y validación de una hipótesis). 

El programa procede, a grandes rasgos, de la siguiente forma; a medida que se 
dan a la máquina casos sucesivos de la clase 4 y 4, éstos se almacenan en dos lis- 
tas separadas de la memoria. El modelo aprende un concepto haciendo crecer un 
árbol de clasificación (procesador serial); este árbol y las etiquetas del concepto, A 
y A, almacenados en sus nodos terminales, bastan entonces para clasificar todos 
los casos posteriores. Por ejemplo, un árbol paca la disyunción inclusiva (2M 0 45, 
o ambos) es el que aparece en la figura 12,108, y para la disyunción exclusiva (QM 
6 45, pero no ambas), el de la figura 12,10b. Los nodos del árbol formulan pregun- 
tas relativas a un valor del atributo; y según la “respuesta”” del patrón de entrada, 
se le envía por la rama izquierda o derecha hacia un nodo inferior. 

El aprendiz de conceptos de Hunt es un algoritmo que posee una estrategia hilista, 
que busca características comunes en los objetos que se clasifican de modo pa- 
recido. Dadas las listas coetáneas de los patrones A y A, busca una o más carac- 
terísticas siempre presentes en una bsta pero no en la otra. Si se encuentran esas 
características, se les convierte en el primer nodo del árbol de clasificación y se 
soluciona el problema, Esto basta únicamente si el concepto es la afirmación o la 
negación de cualquiera de los elementos (por ejemplo, 2M) o una conjunción de 
elementos. Sino se encuentra tal característica, entonces se compone un primer 
nodo de la característica que ocurra con más frecuencia en los casos positivos. 
Este nodo produce dos nuevos pares de sublistas; es decir, listas de casos posi- 
tivos y negativos que poseen o no la primera característica. Ál tratar a cada par de 
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las sublistas como problema separado, el programa recurre de nuevo a la estra- 
tegia hobista (recurre al comienzo) en cada subproblema, y a partir de allí cons- 
truye un segundo y tercer nodos del árbol de clasificación. El lector puede veri- 
ficar que esas dos recurrencias bastan para resolver cualquier concepto de dos 
elementos; por ejemplo, las disyunciones que aparecen en la figura 12.10. La 
recurrencia continúa —o el árbol de decisiones crece— hasta que se han clasi- 
ficado correctamente todos los patrones de la memoriz. 

En el programa de Hunt, las rutinas de crecimiento del árbol terminarán, de una 
u otra forma, por egar a una solución consistente en clasificar de modo correcto 
todos los miembros de su lista A y A. El árbo) de decisiones que hace crecer no 
ofrece ninguna garantía de ser el más simple en sentido lógico; pero, de hecho, re- 
sultó así en la mayor parte de los ensayos simulados del programa. Hunt, Marin y 
Stone (1966) han informado de varios experimentos acerca del comportamiento 
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del modelo. El principal testimonio para considerarlo como candidato inicial para la 
simulación de cómo la gente resuelve problemas conceptuales, es que el orden de 
clasificación de la dificultad en la solución de conceptos de diferentes tipos lógicos 
resultó aproximadamente el mismo que en el programa de que se sirve la mayoría 
de las personas. A lo sumo, se trata de una restricción débil, y no de una prueba 
exigente a la cual someter un modelo razonable. La dificaltad en la adquisición de 
un determinado concepto se correlaciona a grandes rasgos con la longitud del 
enunciado lógico que se necesita para definirlo, Por ejemplo, '*2M”” es más fácil 
que “'2M y 45”, el siguiente en grado de dificultad; “2M o 45, o ambos" es el 
que sigue, y ''2M y 45,0 no2M y no 45” es el más difícil, Un resultado bastante 
más convincente sería el que las clasificaciones de los patrones que hace el sujeto, 
ensayo par ensayo (mientras aprende), fueran predichas mejor por el modelo que 
por las respuestas de otro sujeto que aborda el mismo problema. 

Las deficiencias del rnodelo, considerado como simulador, son su gran memoria, 
su racionalidad, y su confianza en una estrategia holista. Los seres humanos po- 
seen memorias que tienden al error; no siempre son racionales, siguen estrate- 
gias de búsqueda flexibles que se modifican con facilidad, en virtud de 
instrucciones o de una reducida práctica con problemas de determinado tipo 
(Baygood y Bourne, 1965). G. F. Wiiliams (1971) ha propuesto un modelo más 
realista que incorpora consideraciones de memoria de corto plazo; su modelo su- 
pone dos almacenes de memoria: un separador de corto plazo para valores de es- 
tímulo a los cuales ha atendido recientemente, y una memoria de largo plazo que 
mantiene evaluaciones de dimensiones de estímulo que el sujeto ha comprobado y 
rechazado como carentes de importancia. La información en estos dos almacenes 
presumiblemente interactúa; las primeras decisiones acerca de lo que no es im- 
portante ayudan a determinar la hipótesis actual, que sirve para enfocar la aten- 
ción y, por lo tanto, determina qué nuevos atributos de estímulo entrarán en el 
separador de corto plazo; la información del separador, a su vez, se emplea para 
desarrollar una nueva hipótesis de operación cuando se demuestra que la actual es 
errónea. Las dimensiones de estímulo que hán sido comprobadas y que han resul- 
tado irrelevantes tienen sus “fuerzas”? en la memoria de largo plazo reducidas 
casi a cero, de lo cual se recuperan gradualmente (es decir, su irrelevancia se olvi- 
da). Williams programó estos procesos de enfoque y ajuste de acuerdo con las 
ideas anteriores de Hunt acerca de la forma en que el sujeto selecciona una nueva 
hipótesis después de un error, El modelo proporciona un número de predicciones 
potentes de ensayo a ensayo, con respecto a cómo se altera la hipótesis del indivi- 
duo según la naturaleza de la desigualdad entre su hipótesis actual y el patrón que 
clasificó incorrectamente, Williams demostró la credibilidad ¿parente de su mo- 
delo en dos experimentos, por medio de individuos experimentados, quienes sa- 
bían que la hipótesis correcta incluía una conjunción de dos características (otras 
reglas del concepto se pueden manejar al modificar el algoritmo para la elaboración 
de hipótesis nuevas). En algunos aspectos, el modelo de Williams es el más realis- 
ta a pesar de haber sido producido para la clase de los conceptos lógicos y simples, 
los cuales fueron estudiados por los psicólogos dentro de esta tradición. 

Sin embargo, la deficiencia fundamental de estos modelos proviene de su res- 
tricción a únicamente los conceptos de tipo Hovland; es decir, el formato de las 
descripciones atributo-valor en donde los conceptos se definen mediante opera- 
ciones lógicas en parejas de atributo -valor (sin ser x, b y c, do e). Tales espacios 
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de descripción no son lo suficientemente ricos como para representar un gran nú- 
mero de los conceptos que la gente aprende y usa. Por ejemplo, las nociones mé- 
tricas y correlativas, tales como ''x €s supertor q y”, ''x es més largo que y,” no 
pueden representarse en estos términos, ni tampoco muchos de nuestros concep- 
tos que se definen mediante las relaciones entre sus partes. Por ejemplo, el con- 
cepto de la letra E requiere de una enunciación de sus partes (tres líneas hori- 
zontales pequeñas y una vertical más grande) con cierta relación entre sí (líneas 
horizontales, una encima de otra y paralelas, con sus extremos izquierdos hacien- 
do contacto con la línea vertical, etcétera). Se proporcionan espacios de descrip- 
ción más detallados en programas posteriores, tales como el de Winston (1970), 
en el cual se describen las escenas visuales y los objetos en términos de propie- 
dades y relaciones entre sus partes. 


El problema de la segmentación y el 
aprendizaje perceptual 


Muchos de Jos programas se desarrollan para identificar caracteres simples y 
aislados presentados uno por una, Pero esto es irreal en la mayor parte de las cir- 
cunstancias. Por ejemplo, la escritura cursiva a mano fluye de modo continuo, y un 
gran problema para analizarla (para las secretarias, para quienes califican exáme- 
nes, y también para las computadoras) es encontrar una segmentación correcta; es 
decir, determinar en donde están las fronteras que delimitan dónde termina un carác- 
ter y comienza otro. Esta parece una tarea trivial, ya que se trata de una habilidad que 
tenemos muy aprendida; pero la dificultad surge cuando hay que descifrar una es- 
critura desconocida y casi ilegible. El mismo problema se presenta en el recono- 
cimiento del habla, donde sólo un oyente experimentado puede escuchar las pau- 
sas entre segmentos de palabras o entre oraciones. Sin embargo, un registro 
acústico del habla fluida sólo revela una corriente razonablemente continua de 
sonido, El enigma es cómo los mecanismos analizadores del habla pueden arre- 
glárselas para segmentar esta corriente casi continua de fonemas, palabras y fra- 
ses. El problema de la segmentación es muy grave para los programas de recono- 
cimiento de caracteres, ya que sin una rutina de segmentación nunca serán 
capaces de analizar un patrón complejo en sus componentes. Una máquina que 
sabe cómo clasificar letras aisladas del alfabeto, en ausencia de un programa de 
segmentación trataría, a cada palabra de dos o tres letras sencillamente como un 
patrón nuevo que ha de aprenderse como una unidad completa. Un programa de 
segmentación dividiría la palabra en letras, describiría y reconocería estos objetos 
individuales, así como las relaciones que tienen entre sí en la palabra de entrada. 
Con tales capacidades, el sistema podría percibir (describir) ura infinita variedad 
de escenas, todas ellas nuevas en uno u otro detalle, empleando un vocabulario 
relativamente pequeño más unas cuantas relaciones (tantas como miles de pala- 
bras impresas sean generadas a partir de 26 letras más un “derecho de” relación 
espacial). 

Uno de los primeros programas que trataron con el problema de la segmen- 
tación de una forma efectiva fue el MAUDE (Gold, 1959), al descifrar auto- 
máticamente el código Morse. El código se basa por completo en la discrimi- 
nación de las duraciones temporales de los periodos de seña) y los de silencio. En 
principio, una raya debe ser tres veces más larga que un punto; los espacios de si- 
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lencio entre las rayas o puntos dentro de una letra han de ser tan largos como un 
punto; los espacios silenciosos entre las letras, tres veces más largos; y los espa- 
cios entre las palabras, siete veces más largos que un punto. En la práctica, los 
sujetos humanos que envían mensajes cifrados varían en la producción de esas dura- 
ciones, y esta variabilidad es la fuente de confusión. Al descifrar, el trabajo más di- 
fícil consiste en separar los espacios entre las letras del espacio dentro de las 
letras. El MAUDE utiliza mformación contextual para decidir esto. Como no hay 
ningún carácter Morse mayor de cinco puntos o rayas, se supone que el mayor de 
seis espacios consecutivos es un espacio entre letras, y que el más corto es un es- 
pacio dentro de una letra. Los otros cuatro espacios de los seis se clasifican con 
arreglo a si están arriba o por debajo de una duración de umbral (continuamente 
ajustable al remitente particular), Si los espacios tentativos no permiten un código 
de letras en Morse, el espacio más largo se reclasifica como un espacio entre le- 
tras. Se usan procesos parecidos para diferenciar los puntos de las rayas. En su 
ejecución, la tasa de error del MAUDE es sólo un poco mayor que la de recep- 
tores de código bien entrenados. 

El MAUDE trata con el problema de la segmentación sólo por un dominio limi- 
tado de entrada. Desde un punto de vista psicológico, son más significativos los 
programas de Guzmán (1968) y de Winston (1970), que analizan y describen esce- 
nas visuales compuestas de bloques sólidos en varias relaciones. En la figura 
12.11 se ilustra el tipo de escenas de bloque que analiza el programa SEE de Guz- 
mán. Consisten en una variedad de líneas, ¿ngulos, superficies y objetos (cubos, 
ladrillos, cuñas), dispuestos en varias relaciones superpuestas. El programa inten- 
ta aislar los objetos e identificar las superficies que se corresponden. El lector 
debe apreciar lo difícil que es este trabajo para escenas como las de la figura 
12.11. Incluso si presuponemos que el programa identifica objetos simples como 
cuñas, bloques y pirámides, las escenas desordenadas presentan Otros tres pro- 
blemas: primero, cualquier objeto puede aparecer en cualquier orientación y pers- 
pectiva, de modo que proyecta una imagen bidimensional nueva para el sujeto que 
lo ve; segundo, los objetos se cubren parcialmente unos a otros, y por eso deben 
identificarse aun cuando sus características regulares estén ocultas por otros obje- 
tos; tercero, esa oclusión significa que el programa debe decidir qué característi- 
cas concuerdan con qué objetos. 

El programa SEE de Guzmán procede al identificar primero varios tipos de vér- 
fices entre las superficies, y cada tipo sugiere una clase particular de nexo de las 
superficies en uno o más objetos. En la figura 12.12 se muestran nueve de los vér- 
tices comunes junto cón sus nombres, La flecha proporciona evidencia de que las 
dos regiones limitadas por los ángulos pequeños son lados adyacentes de un ob- 
jeto. La horquilla sugiere que los tres pares de lados son adyacentes en cada uno 
de los tres bordes, como la esquina de un cubo. 

Como ejemplo de la manera en que se usan estos vértices para caracterizar un 
objeto, véase el cubo sólido de la figura 12.134. Los vértices críticos se han identi- 
ficado con líneas más oscuras. La esquina más cercana a nosotros es un vértice de 
horquilla, con tres vértices de flecha hacia abajo, y a derecha e izquierda de la Aor- 
quilla. Las tres esquinas restantes son vértices £. La horquilla y las flechas pro- 
porcionan la información necesaria para segmentar esta figura, Al observar estos 
vértices y la manera en que se relacionan, el programa SEE conecta superficies 
particulares y decide cuál representa diferentes lados del mismo objeto; estas co- 
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Figura 12.11. Ilustración de 
una escena de bloques des- 
ordenados analizada por el 
programa SEE, de Guzmán 
(tomada de Winston, 1970). 


nexiones tentativas se indican mediante las flechas curvadas en la figura 12.134. 
El programa decide que la figura es un cubo al sumar las sucesivas restricciones 
sugeridas por cada vértice y sus interconexiones. Para considerar un segundo 
ejemplo, los vértices T y T igualada son importantes para sugerir que una figura 
oculta a la otra, que está detrás, Esto se advierte en la figura 12.13b, donde se 
muestra tal escena con los vértices 7 importantes resaltados. Medíante un con- 
junto de heurísticas de "buena continuación””, el programa SEE identifica las T 
izquierda y derecha, y así integra la superficie A con la B, y la C con la D, y las 
identifica como superficies de un ladrillo acostado que está tapado por otro en po- 
sición horizontal. 

Estas breves descripciones no pueden hacer justicia a la extensión de heurísti- 
cas que el SEE emplea para segmentar e identificar objetos en una escena tan 
desordenada como la que aparece en la figura 12.11. Aunque el SEE aísla superí- 
cies y objetos, no proporciona una descripción muy certera de la escena en térmi- 
nos de relaciones entre objetos identificados. Un programa de Winston (1970) 
hace exactamente lo mismo, al imponer ciertas premisas inteligentes sobre el 
mundo visual (por ejemplo, que los cubos están sobre una mesa o encima de otros 
cubos en vez de fotar en el aire). Winston toma la salida det SEE como entrada 
para su programa, que reconoce entonces relaciones geométricas entre objetos 
(como encima, enfrente de, está apoyado por, linda con), así como las propiedades 
de objetos aislados. El programa de Winston efectúa tipos particulares de descrip- 
ciones estructurales de una escena, las representa en términos de un formalismo 
particular, y trata de identificar configuraciones mediante conceptos y escenas con 
los cuales está familiarizado. Los conceptos se representan dentro de la memoria 
como redes relacionales etiquetadas; éstas sirven como los '*prototipos de clase” 
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Figura 12.32. Ilustración de 
nueve vértices comunes 
usados por el programa de PICO 


Cuzmán en la segmenta- 
ción de escenas de bloques 
(tomara de Winston, 1970). MULTI 
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en la memoria para conceptos tales como ángulo, vértice de flecha, articulación-T, 
recilóngulo, triángulo, cuña, ladrillo, casa, tienda y arco. En la figura 12,14 se 
ilustra un fragmento de la representación de conceptos de nivel intermedio, como 
cuña y arco. La descripción estructural de una cuña estipula que ésta comprende 
(para el ojo del sujeto que la contempla) tres superficies, dos de las cuales son un 
tipo de rectángulo, mientras que la tercera debe ser un triángulo. Por supuesto, 
esta segunda característica, distingue una cuña de un ladrillo. Así, cuando se le 
muestra una cuña, el programa de nivel inferior identifica primero líneas, bordes, 
ángulos y superficies, y luego las superficies rectangulares y triangulares, para 
construir gradualmente una descripción de la escena. Cuando ésta se compara en 
fa memoria con el conjunto de objetos conocidos (descripciones de concepto), la 
mejor igualación se produce para el concepto cuña. El mismo proceso se aplica al 
concepto arco que se ilustra en la figura 12.145. 
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Figura 12.13. 
Ejemplos de 
vértices críti- 
cos (oscuros) 
que intervie- 
nen en la iden- 
tificación de 
un cubo (a) y 
otro que oculta 
a un segundo 
bloque (hb) 
(adaptada de 
Guzmán, 1968). 
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Figa ra 12.14. Estructuras de gráfica relacional que caracterizan al concepto de una 


cura y un arco (adaptada de Winston, 1970) 
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Aprendizaje de conceptos de orden 
superior a partir de ejemplos 


En el programa de Winston, los conceptos de orden superior se construyen a 
partir de relaciones entre conceptos de orden inferior, Por ejemplo, una piía o 
torre es un conjunto de rectángulos alineados y que se apoyan unos en otros; una 
tienda, dos cuñas que lindan de una manera particular; una mesa, un ladrillo 
apoyado sobre otros ladrillos en posición vertical o cuñas (““patas'*) en cuatro es- 
quinas, etcétera, 

Winston se interesaba por el problema de enseñarle a la máquina conceptos 
geométricos complejos como arco, mesa, casa y arcada, entre otros. Desarrolló 
Un programa que aprendería mediante la exposición a una serie de ejemplos y no- 
ejemplos del concepto que enseñaba. Un ejemplo positivo inicial conduce a una su- 
puesta descripción; por ejemplo, el concepto de casa (véase la figura 12.15). A) 
contemplar la escena que aparece en la figura, el programa de Winston describiría 
una casa como una cuña apoyada en un ladrillo, En los tres cuadros siguientes de la 
figura 12.15 se muestra una serie de patrones de entrenamiento que contienen lo 
que el citado autor denomina yerros por poco; es decir, configuraciones que se 
asemejan a una casa pero difieren de ésta en uno u otro aspecto. Cuando a la má- 
quina se le dice que Ja configuración en el cuadro (6) “'no es una casa”, describe la 
diferencia entre los cuadros (a) y (b), selecciona alguna diferencia especíáca como 
crítica, y vincula a su concepto revisado de *'casa”” que la cuña debe estar (enfática- 
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ES 
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Figura 12.15. Ejemplo 

del concepto de una 

cása y tres instancias 
negativas de “yerros por 

poco" (tomada de Win- c) 
ston, 1970) 
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mente) apoyada sobre el ladrillo. De modo similar, ej cuadro (c) informa a la má- 
quina que el objeto superior debe ser una cuña y no un ladritlo, y el cuadro (4) le in- 
forma que el objeto inferior debe ser un ladrillo y no una cuña. Estos marcadores 
enfáticos (“debe ser'”) se unen a la descripción fina) del concepto (figura 12.16), y 
deben satisfacerse para que la máquina clasifique corno casa a cualquier patrón 
muevo. 

El programa de Winston trae a colación varios puntos interesantes. En primer 
Ingar, la manera en que el aprendiz de conceptos asigna prioridad a diferencias da- 
das (entre su hipótesis presente y un caso que la infringe). En realidad, general- 
mente hay muchas diferencias; como experimentados aprendices de conceptos 
hemos tendido a aprender estrategias generales acerca de lo que es probable que 
sea importante en vez de las diferencias no pertinentes, y a usar las diferencias de 
prioridad elevada para modificar nuestras hipótesis de concepto anteriores. Una 
segunda cuestión que sugiere el enfoque de Winston es el problema de las se- 
cuencias óptimas de enseñanza: puesto que podemos especificar la forma final de 
la descripción de un concepto, deberíamos ser capaces de disponer la presenta- 
ción de una serie de yerros por poco, que orienten eficientemente al aprendiz 
hacia el concepto correcto. Los psicólogos infantiles preocupados por la forma en 
que el niño desarrolla ciertos conceptos piagetiarios (de la conservación de la 
masa, el volumen, tamaño, causalidad, tiempo) se han interesado mucho por esta 
cuestión de las secuencias óptimas de entrenamiento. 

El aprendizaje elemental de concepto conduce a la complejidad y a una eventual 
destreza. De la misma manera en que lo haría un niño, el aprendiz de concepto de 
Winston se vuelve más experto para formar partes sustanciales de algo y describir 
escenas del mundo de los cubos. Un resultado de esta destreza es que las escenas 
nuevas y complejas provocan una descripción relativamente compacta, realizada 
por el modelo. Por ejemplo, considérese la escena que aparece en la figura 12.17, 
compuesta por una tienda a la izquierda de una casa, ambas colocadas encima de 
unarco. En esta escena hay por lo menos siete objetos simples (ladrillos y cuñas), 
y allí se exhiben muchas relaciones interobjeto. Antes de que el sistema aprenda 


UNA PARTE ES 


DEBE ESTAR 

APOYADA EN 
Figura 12.16. Descripción del 
concepto de una casa en térmi- 
nos de relaciones etiquetadas en- 
tre nodos de conceptos primiti- 

DEBE SER vos. A grandes rasgos, esto dice 

UN TIPO DE que una casa tiene dos partes, 
una debe ser un tipo de cuña y 
otra un tipo de ladrillo; la cuña 
debe estar apoyada en el ladrillo 
(tomada de Winston, 1970). 


472 Segunda parte. Teorias cognoscitivoorganizacionales 


bss conceptos de nivel intermedio (de tienda, casa, arco), la totalidad de estas par- 
tes y sus innumerables relaciones tendrian que aparecer en la descripción de la es- 
cena. Sin embargo, después de que el sisterna ha aprendido estos conceptos, se 
les puede utilizar como unidades para simplificar la descripción global hasta algo 
que se aproxime a nuestra proposición verbal ““una tienda a la izquierda de una 
casa, y ambas colocadas sobre un arco”. Ciertamente, después de que el sistema 
sea expuesto a la escena, ésta (o más bien, su descripción) se almacenaría en la 
memoria como cualquier otro concepto, y tal vez se le daría un nombre interno 
(por ejemplo, “'la creación arquitectónica de Bill'*), Una re-presentación posterior 
de la escena conduciría entonces a la memoria de reconocimiento; es decir, el sis- 
tema reconocería que ha visto antes esa escena. Por está razón, la memoria de re- 
conocimiento de individuos o escenas individuales (o lugares) en esencia no difiere 
del hecho de clasificar un patrón en una categorfa particular. 

El programa de Winston representa uno de los trabajos más avanzados y psico- 
lógicamente interesantes que se hayan realizado en el análisis de escena. Trata 
con un ambiente básicamente estático de cubos de juego. Las heurísticas de los 
programas de Winston y de Guzmán se usan en los proyectos *“mano-ojo'” en 
Stanford y MIT, y en el *robot'* del Stanford Research Institute, proyectos éstos 
que examinaremos en una sección posterior. El progreso continúa en lo que con- 
cieme a los problemas del análisis mecánico de escenas naturalistas, como foto- 
grafías de salas desordenadas, jardines, bosques, laderas, etcétera. Se han desa- 
rrollado programas avanzados de reconocimiento de patrón para extraer y usar 
información óptica como la perspectiva lineal, los gradientes de textura y las 
sombras, para dar descripciones útiles de escenas visuales complejas. Hanson y 
Riseman (1978) han publicado un conjunto de artículos acerca de estos temas. 


Percepción del habla 


Otra fructífera línea de investigación se refiere al reconocimiento del habla. La 
meta consiste en hacer que una computadora '*escuche”” a casi cualquier persona 
que hable y diga casi cualquier cosa e imprima (por ejemplo, en inglés) una conje- 
tura razonable de su expresión, Como hemos dicho, el había fluye de modo uniforme 
con fonemas sucesivos que se combinan unos con otras, de modo que el pro- 
blema de la segmentación es muy difícil, Para complicar aún más las cosas, la 


Figura 12.17. Fjemplo de una es- 
cena compleja compuesta de 
conceptos familiares de nivel in- 
termedio (partes) en relaciones 
especificables. Tales escenas re- 
cuerdan una descripción ¡crár 
quica del programa de Winston 
[tomada de Anderson y Buwer, 
1973) 
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combinación de fonemas suresivos es tan amplia que el sonido de un determinado 
fonema varía de acuerdo conlos que se pronuncian inmediatamente antes o después 
de €l. (Una analogía sería que las vocales a, e, 1, o, 4 se imprimieran de modo lige- 
ramente distinto, según las consonantes impresas antes y después de ellas.) La 
única manera de tratar con todos estos problemas es mediante un fuerte uso del 
contexto y de las expectativas acerca de lo que debería decirse en una expresión, 
en lugares dados. Un impresionante sistema de reconocimiento del habla es el 
Hearsay 11 (Reddy et al., 1973), que analiza las expresiones de una persona que 
habla, a medida que ésta anuncia sus movimientos en un juego de ajedrez. En el 
Hearsay 11 se combinan diversas fuentes de información: el análisis del especto- 
grama del habla para destacar características fonéticas principales, la combinación 
de grupos de características en pafabras probables, y fuertes expectativas de las 
clases de palabras por escuchar en un punto determinado de una expresión. Estas 
expectativas se producen por el conocimiento que el programa tiene del ajedrez y 
de la gramática (por ejemplo, después de “peón”' o ““reina'” esperar un adjetivo 
como **blanco”” o *'negro””), Su conocimiento del ajedrez permite al programa an- 
ticipar el nombre de un movimiento específico y, por lo tanto, efectúan su no- 
tificación, en vez de hacer aJgún otro movimiento. El éxito de los programas de re- 
conocimiento del habla depende en gran medida de lo bien que puedan prever lo 
que está a punto de decirse, Ásí, en el grado en que las expectativas reducen el 
número de palabras alternativas que puedan escucharse en cualquier punto dado 
de la expresión, la cantidad de información de estímulo necesaria para identificar 
correctamente la palabra puede reducirse de la manera correspondiente. Aunque 
hasta la fecha la ejecución del Hearsay 17 en el reconocimiento del habla ha sido 
muy notable, nos percatamos de lo enorme que es la tarea futura de extender el 
modelo para comprender conversaciones en muchas áreas de contenido, y para 
tratar con observaciones inesperadas. 

Quizá más que ningún otro programa, el ZJeaysay II destaca la idea de combinar 
los análisis de datos sensoriales con expectativas determinadas por el contexto. 
Un programa que funcione hacia arriba, usando la entrada sensorial para sugerir 
hipótesis de patrón, se denomina procesador de abajo-arriba, mientras que aquel 
que trabaja hacia abajo, utilizando poderosas expectativas (hipótesis) para guiar la 
búsqueda de evidencia en la disposición sensorial, se llama procesador de arriba- 
abajo, La mayor parte de los programas logrados emplean procesos de abajo-arri- 
ba y de arriba-abajo combinados, para sintetizar una hipótesis final acerca del pa- 
trón por reconocer. El Heersay 11, por ejemplo, combina información de cuatro o 
cinco diferentes fuentes: su conocimiento del juego de ajedrez y de los nombres 
de las piezas, de la gramática y de las secuencias fonéticas, así como de las carac- 
terísticas acústicas y las relaciones de éstas con los fonemas. Esta compleja 
síntesis de fuentes de información es necesaria para tratar con tareas complejas. 
El reconocimiento del habla es un buen ejemplo de la gran diferencia existente 
entre la ““sencillez”” intuitiva de una habilidad psicológica y la reconstrucción cien- 
tífica de esa habilidad. Muchas habilidades cognoscitivas parecen simples debidó a 
que han sido sobreaprendidas y practicadas durante muchos años; por lo mismo, 
se han vuelto '“automáticas”” y se ejecutan fuera del estado consciente. Con fre- 
cuencia son esas mismas habilidades rutinarias y automáticas las que resultan difí- 
ciles de reconstruir en un modelo teórico. 

Nuestra revisión de los programas que tratan con el reconocimiento de patrón 
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es breve pero ilustra las principales tendencias. En el lenguaje, el trabajo acerca 
del reconocimiento del carácter individua) se ha sustituido por el del reconocimien- 
to del habla continua; en lo que toca a la visión, la tendencia se dirige al análisis de 
escenas más complejas, que se calcula en términos de derivaciones de descrip- 
ciones estructurales de las partes y de sus interrelaciones en la escena. La des- 
cripción estructural debe ser breve (para el almacenamiento en una memoria finita), 
selectiva en lo concerniente a características relevantes, pero también lo bas- 
tante rica como para apoyar todos los tipos de solución de problema y razonamiento 
visual (por ejemplo, resolver problemas de analogía geométrica). En la inves- 
tigación actual el Enfasis se pone en los problemas difíciles de segmentación, 
identificación de relaciones y construcción de descripciones jerárquicas, aunque 
la identificación de objetos particulares sigue siendo un componente estándar de 
todos los programas de análisis de escena. 

Estos ejemplos del reconocimiento de patrón nos han introducido a otros 
problemas; por ejemplo, ¿es el programa Hearsey Ef o el de Winston una simula- 
ción o una pieza de inteligencia artificial? El hecho de que un programa resuelva al- 
gunos de los problemas a que se enfrenta el cerebro humano no significa que sea 
una simulación exacta del mismo, puesto que se requiere de otros criterios de 
ajuste a los datos reales. La “'realidad psicológica'* de varios de esos programas 
no se ha sometido a pruebas verdaderamente rigurosos. Lo que los psicólogos en 
realidad necesitan es alguna metodología para comprobar de rnodo experimental 
muchas de las ingeniosas hipótesis y de las heurísticas sugeridas por los progra- 
mas como los que acabamos de reseñar. 


Aprendizaje de patrón secuencial 


Los patrones visuales tienen su información simultáneamente distribuida en el 
espacio. Ahora consideraremos los patrones que están extendidos en el tiempo, 
en una serie temporal. Se examinarán dos programas: uno que trabaja con el 
aprendizaje de probabilidad y otro con la tarea de extrapolación de series en prue- 
bas de C/, Ambos tratan de modelar el intento del sujeto para llegar a una hipó- 
tesis acerca de las secuencias de eventos. 


Aprendizaje de probabilidad 

Feldman (1961, 1962) ha propuesto un modelo inicial para simular la conducta 
de sujetos en el experimento binario conocido como aprendizaje de probabilidad. 
En esos experimentos, que se describieron en el capítulo 8, el sujeto intenta pre- 
decir miembros sucesivos en una secuencia de eventos binarios (por ejemplo, € o 
P) que se le muestran uno a la vez. Las secuencias se construyen aleatoriamente 
(por ejemplo, 70% de eventos C y 30% de eventos P), aunque los sujetos a me- 
nudo creen que la secuencia es ordenada y tratan de descubrir su patrón. La ex- 
plicación tradicional de la conducta en esta situación es la que ofrecen los modelos 
estocásticos del aprendizaje, los cuales suponen que la probabilidad que tiene el su- 
jeto de predecir € aumenta o disminuye ensayo por ensayo, según ocurra el 
evento C o el P. De nuestra revisión en el capítulo 8 se recordará que a estos 
modelos se les dificulta explicar los patrones secuenciales en las respuestas del 
sujeto, 


Cap. 12. Teorias del procesamiento de información 475 


El modelo de Feldman supone que en esta situación el sujeto pretende descu- 
brir patrones locales (o probar hipótesis de secuencias) para explicar la secuencia 
del evento y extrapolar (predecir) el siguiente miembro de la serie, Para obtener 
información inherente a estas nociones, Feldman hace que sus sujetos “piensen 
en voz alta” y enuncien sus razones ensayo por ensayo respecto a la predicción 
que han realizado. El protocolo de un sujeto consiste entonces en la secuencia de 
sus predicciones, y en las razones que proporcionó acerca de cada una de ellas. El 
modelo de Feldman intenta explicar la secuencia de razones, teniendo en cuenta 
que el sujeto casi siempre hizo una predicción consecuente conla razón que dio. El 
modelo se ajusta específicamente a la simulación de un sujeto particular, y los 
detalles del programa varían de un sujeto a otro, 

El programa opera al probar las diferentes hipótesis encaminadas a explicar 
la secuencia del evento. El ciclo de ensayo a ensayo del modelo es así: se utiliza la 
hipótesis coetánea para predecir el suceso siguiente; se formula una hipótesis de 
predicción y se usa para predecir el evento siguiente; el evento inmediato ocurre, 
y el ciclo se repite. 

Cada hipótesis consta de dos componentes: una hipótesis relativa al patrón 
del evento y un componente de conjetura para lo contrario. La hipótesis del patrón del 
evento se selecciona con base en una lista de hipótesis de patrones tales como la 
“progresión de las C””, “la alternancia de 2C y 2P” y asf sucesivamente. El in- 
vestigador se encarga de colocar los patrones en esta lista, después de examinar 
los tipos que el sujeto dijo haber utilizado, El componente de la conjetura contraria 
puede ser *“encendido”* o *'apagado””; si la hipótesis del patrón es una progresión 
de las C y este componente se apaga, el modelo predice C; si el componente de 
conjetura opuesta está encendido, el modelo predice P, lo contrario del patrón. 

Se aplican varias reglas en las cuales la retroalimentación de la secuencia del 
evento se utiliza para seleccionar, alterar o mantener la hipótesis del momento. Si 
predice con error, es probable que se le sustituya temporalmente. En este caso, 
se usan los eventos de los íltimos 3 o 4 ensayos para seleccionar los candidatos 
plausibles de la lista de hipótesis del patrón. Si varios candidatos son plausibles, el 
programa elige la hipótesis del patrón utilizada más a menudo en el pasado. Las 
circunstancias en las cuales se produce la modificación componente de la conjetura 
contraria son muy complicadas y no pueden resumirse con facilidad. 

Feldman (1962) ha publicado el resultado de ajustar el modelo a la conducta de 
un sujeto. Su procedimiento consistía en revisar continuamente el modelo hasta 
que logró un buen ajuste. El autor resume el proceso de la siguiente forma: 


Dar fin al modelo fue una tarea prolongada que implicó el procedimiento reiterativo de 
proponer un análisis detallado, probarlo en comparación con los datos, modificarlo, y así 
una y otra vez. En el transcurso de este procedimiento, se modificó o sustituyó casi cada 
paste del modelo originalmente planeado (pág. 342). 


Una característica original de la evaluación del modelo de Feldman fue su uso de 
la predicción condicional. Si la predicción del modelo de la hipótesis del sujeto en el 
ensayo n era incorrecta, se le regresaba a la pista correcta reemplazando su hipó- 
tesis “predicha'' por la hipótesis real del sujeto. Se pensaba que el modelo depen- 
día mucho de la vía, en el sentido de que si está “"apagado”” en el ensayo n y no se 
le coloca de nuevo en el camino correcto se apartará progresivamente de los 
datos. 


476 Segunda parte. Teorias cognoscitivoorganizacionales 


Estos dos puntos metodológicos, los modelos ajustados a individuos y las pre- 
dicciones contingentes, son algo original en el trabajo de Feldman. Baste decir que 
con el empleo de estas técnicas, Feldman demostró que su modelo podia predecir 
el protocolo de un sujeto con un alto grado de exactitud. 


Extrapolación de series 

El programa de Simon y Kotovsky (1963) trata de resolver un problema secuen- 
cial de aprendizaje de patrón con el que estamos familiarizados debido a varias 
pruebas de C7. Dicho programa intenta inferir la regla que genera letras sucesivas 
en una serie corta. En la prueba de completar series de letras (Letter Series Com- 
pletion Test) de Thurstone, se muestra al sujeto una serie de letras y se le pide 
que propurcione la siguiente letra correcta de la serie. Ejemplos son cadacafa, 
atbataatbat y wxraxubuzczadab. Estas series varían en dificultad y son lo suficiente- 
mente complicadas como para que ante ellas falle una apreciable proporción de es- 
tudiantes universitarios. El programa de simulación de Simon-Kotovsky supone 
que el sujeto resuelve tales problemas al desarrollar una “descripción del patrón'' 
de la secuencia, que usa después para generar el siguiente miembro de la serie. 
Se cree que el sujeto modelo posee cierto equipo cognoscitivo con el cual co- 
mienza, y éste consiste en el alfabeto hacia adelante, el alfabeto hacia atrás, el 
concepto del “sucesor siguiente” en una lista particular, y la capacidad para 
detectar y producir ciclos a través de una lista (por ejemplo, en las instancias más 
simples el ciclo repetitivo de toda la lista (b, a) produce la serie bababa...). 

Se usa un formato estándar para enunciar las descripciones del patrón, y la prin- 
cipal tarea del programa es encontrar una descripción adecuada de dicho patrón, 
Primero identifica periodicidades en la secuencia, al observar las relaciones que se 
repiten a intervalos regulares, Por ejemplo, axbxcx tiene un periodo 2 y se basa en 
la “siguiente” relación alfabética hacia adelante a partir de e, y con la letra x que 
se repite al final de cada ciclo de dos; greprboxc tiene un periodo 3, en el cual el 
primer elemento de cada tríada utiliza el alfabeto hacia atrás comenzando en g, y la 
tercera letra de cada tríada usa el alfabeto hacia adelante a partir de e, La relación 
que se repite en el periodo 3 es el ““siguiente sucesor”” del elemento correspon- 
diente en la tríada anterior. Si esta periodicidad simple no puede encontrarse, el 
programa busca una relación que se interrumpa a intervalos regulares; por ejem- 
plo, en aaabbbeccad, la relación '*misma letra” se interrumpe en periodos de 3. 
Una vez que se ha encontrado una periodicidad básica, el programa efectúa un 
análisis posterior para descubrir los detalles del patrón, detectando las relaciones, 
o sea el siguiente o el mismo sucesor que se mantiene entre elementos dentro de 
un periodo, o entre elementos correspondientes en periudos consecutivos (como 
en gxa..., en el ejemplo anterton). 

Si se encuentra esa regla generadora, se utiliza para la extrapolación del siguien- 
te elemento. Diversas variantes del modelo que difieren en poder (es decir, en la 
riqueza de relaciones que puede detectar y usar) se postularon y compararon con 
la ejecución de estudiantes de niveles bachillerato y licenciatura que resolvían los 
mismos problemas. Una variante débil del modelo se desempeñó menos 
adecuadamente que el sujeto más deficiente, en tanto que una variante poderosa 
funcionó tan bien como el mejor individuo. Se dio un acuerdo considerable entre 
los individuos como grupo y el programa al clasificar los problemas en grado de di- 
ficultad, La dificultad del problerra pareció correlacionarse con la carga de la me- 
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moría inmediata en el individuo y el modelo. A £n de solucionar los problemas difí- 
clles, el individuo tenía que acordarse de su localización en dos listas separadas 
(por ejemplo, el alfabeto hacia adelante y en dirección contraria), mientras que 
para todos los problesnas fáciles únicamente necesitó acordarse de su localización 
en una sola lista. 

Simon (1972) demostró cómo su representación gradual del patrón era compa- 
tible con otras propuestas, las cuales tratan de relacionar la complejidad estructu- 
ral de un patrón en serie con la capacidad de la persona para recordar y reproducir 
una secuencia breve o aprender una secuencia que se repite periódicamente 
(Glanzer y Clark, 1962; Restle, 1970), así como para juzgar, evaluar o clasificar la 
complejidad psicológica de las diversas secuencias (Vitz y Todd, 1969). La medida 
básica de Ja complejidad de la secuencia es la extensión del código interno re- 
querido para describir el patrón gradual en alguna representación apropiada. 
Simon afirma que varias propuestas teóricas concuerdan con el aprendizaje del pa- 
trón gradual, suponiendo que los individuos aprenden secuencias válidas al inducir 
descripciones del patrón, que usan las relaciones del ““mismo”* y el ““sucesor”' (en 
alíabetos numéricos o de letras familiares) entre símbolos, interacción de subpatro- 
nes y estructuras de frases jerárquicas. Estas no son más complejas que lo que se 
requiere para entender las relaciones entre las palabras dentro de una oración. 


PROGRAMAS DE PROBLEMA-SOLUCIÓN 


La mayor parte del trabajo teórico en los modelos PI se ha orientado a la elabo- 
ración de programas con los cuales se analicen y resuelvan los problemas intelec- 
tuales dificiles de carácter específico. La meta de la investigación orientada 
psicológicamente ha sido conseguir que la computadora solucione problemas difíci- 
les de modo similar a los seres humanos. Desde la perspectiva del aprendizaje, la 
solución de problemas es importante, ya que revela la transferencia de las ha- 
bilidades de la persona para percibir o representar la situación problemática, para 
examinar alternativas y recuperar de la memoria las reglas y procedimientos que 
tuvieron éxito con problernas sernejantes, También es interesante el cambio en 
las estrategias de que dispone úna persona para atacar un problema complejo a 
medida que lo resuelve repetidas veces. 

La investigación en la solución de problemas (Bourne ef al., 1979; Duncker, 
1945) ha identificado tres áreas de importancia: la primera se refiere a la manera 
en que la persona ve, interpreta o representa la enunciación de un proble ma ante 
sí misma y termina por comprender de qué se trata; la segunda alude a los proce- 
dimientos empleados al buscar una solución, una vez que la persona cree que com- 
prende el problema; y la tercera se refiere a la forma en que compara una solución 
generada con el criterio de solición, y decide si se produce un pareamiento su- 
ficiente de modo que el trabajo pueda detenerse. Los modelos iniciales de simula- 
ción han hecho a un lado el primer -—y en algunos aspectos más difícil — punto; es 
decir, cómo interpreta e! problema el sujeto. Más bien, se han concentrado en el 
segundo punto. El problema se le da al programa de una forma bien estructurada, 
y el programador asegura que el modelo lo interprete correctamente antes de co- 
menzar a trabajar en él. Otros investigadores han empezado a tratar también con 
los temas más borrosos de la interpretación y representación del problema, y han 
construido algunos programas especiales para ellos (Simon y Hayes, 1976). Los 
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programas de análisis del lenguaje, vinculados a los llamados sistemas de contes- 
tación > preguntas, intentan interpretar de modo correcto las enunciaciones 
(preguntas). Estos sistemas son especialmente poderosos cuando tienen un do- 
minio semántico bien definido dentro del cual se estipulan los problemas; por 
ejemplo, una ilustración esquemática de una escena o un diagrama de circuito eléc- 
trico (véase Coles, 1968; y Winograd, 1972). La representación del espacio 
problemático tiene una importancia crucial, ya que se sabe que un problema dado 
puede ser difícil o fácil según la forma en que se represente internamente. Aunque 
existen valiosas discusiones alrededor del tema (Amarel, 1968; Nilsson, 1971), no 
se han diseñado procedimientos o regias generales para confeccionar la buena re- 
presentación de un problema, a fin de que su solución se torne transparente. 

Es justo decir que el programa teórico lógico de Newell, Shaw y Simon (1958) 
dispuso el patrón básico para muchos de los programas de solución de problemas 
que aparecieron en los años siguientes. El teórico lógico (TL) se diseñó para en- 
contrar pruebas de teoremas enunciados en el cálculo proposicional de la lógica 
simbólica. Tales problemas tienen un formato estándar. Se proporciona algo 
“dado”, A, se conjetura un teorema o enunciación final, B, y el problema para el 
probador del teorema consiste en tratar de transformar lo dado en la enunciación 
fina). Esto debe hacerse usando los axiomas del sistema y las reglas permitidas de 
transformación del lenguaje (sustitución, reemplazo, encadenamiento y desliga- 
miento). Como cualquier estudiante de lógica puede atestiguar, probar un 
teorema a menudo es una tarea difícil y retadora, en la que los fracasos son 
comunes. Como los axiomas y las reglas de transformación pueden aplicarse a lo 
supuesto con una gran variedad de permutaciones de secuencias, el problema con- 
siste en elegir una vía que conduzca al teorema dado. 

En este punto puede introducirse una útil distinción entre los algoritmos y los 
métodos heurísticos en la búsqueda de una respuesta. Un algoritmo es un proce- 
dimiento o conjunto de reglas a seguir, los cuales garantizan que conducirán a la 
solución de una determinada clase de problema: es como una receta perfecta e in- 
falible, Existen muchos algoritmos en las matemáticas; por ejemplo, reglas para 
resolver un conjunto de ecuaciones lineales, para invertir una matriz, para hacer 
una división larga, etcétera. Pero hay muchos problemas para los cuales mo se co- 
noce ningún algoritmo, y se requiere de una estrategia eficiente para orientar la 
búsqueda de solución. Ejemplo de esto es probar teoremas en matemáticas o en el 
cálculo proposicional.? Pero emprender una búsqueda ciega o incluso sistemática a 
través de todas las secuencias lógicas propias que pueden generarse mediante las 
reglas del juego, y cotejar una secuencia que pruebe el teorema, insurniría mu- 
chísimo tiempo y sería terriblemente ineficiente. Uno podría generar consecuen- 
cias lógicas de lo dado, durante años, sin llegar a encontrar jamás una secuencia 
que probase el teorema. 

Obviamente, lo que se necesita es algún medio que permita dirigir la búsqueda 
hacia una meta particular, que detecte cuándo nos estamos acercando, y qué 


2Para los teoremas en el cálculo proposicional (Wang, 1960, 1965) y en el cálculo del predicado de 
primer orden (]. A. Robinson, 1970) se han desarrollado procedimientos de comprobación algoríunica 
basados en los '“principios de resolución”. Sin embargo, estos algoritmos mecánicos son técnicas 
exhaustivas que pareven estar muy alejadas de los métodos heurísticos usados por un estudiante para 
probar un teorema. 
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debemos hacer para aproximarnos más a la respuesta. En el programa teórico ló- 
gico, Neweil, Shaw y Simon utilizaron algunas hewrísticas para dirigir y ayudar al 
proceso de búsqueda. Las heurísticas son reglas empíricas que nos dicen cómo 
buscar de maneras fructíferas o eficientes. Cuando tienen éxito, reducen consi- 
derablemente la búsqueda, aunque no hay garantía de que lo logren. En el TL, la 
heurística principal era **funcionar hacia atrás”* a partir del teorema a comprobar. 
Se busca una o más proposiciones A' que implican al teorema B a través de una 
simple transformación de A'. Entonces se establece el subproblema de deducir 
uno de estos enunciados A' a partir del supuesto Á mediante una transformación 
simple, Si no se puede hacer directamente, se trabaja hacia atrás, partiendo de A" 
y hacia otra proposición A” que implique a A”; y luego se intenta extraer a A” del 
supuesto A. Al desplazarse en sentido inverso en cada paso pueden generarse nu- 
merosos subproblemas; éstos se almacenan en una lista en la cual se debe traba- 
jar. Entonces son editados por rutinas especiales que suprimen aquellos que no 
parecen susceptibles de probarse, y se concede prioridad a los que parezcan fáci- 
les de probar y que en un sentido especial sean “similares” a lo dado. El TL tra- 
baja en orden sobre los subproblemas, en busca de una prueba, Si un subproblema 
no produce una prueba en un tiempo límite, pasa a intentarlo con el siguiente. Si se 
queda sin subproblemas con los cuales trabajar, y no puede generar más, enton- 
ces cede y fracasa en su intento de resolver el problema. En el programa TL hay 
muchos otros procesos, cuyos puntos primordiales se explican con abundancia de 
detalles en los artículos citados. 

En un experimento con el TL se le dieron, en el orden en que aparecieron, los 
primeros 52 teoremas de los Principia Mathematica (una obra maestra de la lógica 
simbólica escrita por Whitehall y Russell, 1925). Si el TL probaba un teorema, se 
almacenaba en su memoria para su posible uso posterior. Con este orden de pre- 
sentación, probó 38 (73%) de los 52 teoremas. Aproximadamente la mitad fueron 
resueltos, y cada uno de ellos en un tiempo menor a un minuto de computación en 
la pequeña máquina. La resolución de la mayor parte de los teoremas restantes in- 
sumió de 1 a 5 minutos. El tiempo requerido para probar un teorema aumentó con 
rapidez con el número de pasos necesarios para la prueba. Otros experimentos 
mostraron que la capacidad del TL para probar un teorema dado dependía del or- 
den en que los teoremas incluidos en el programa proporcionaran resultados críti- 
cos intermedios para demostrar algunos de los teoremas más difíciles, 

Al discutir la ejecución del TL tal como se estudió en varios experimentos, Ne- 
well, Shaw y Simon (1958) indican rumerosas características “humanas” del 
comportamiento de resolución de problemas del modelo. En síntesis, afirmaron: 


Hemos revisado los principales testimonios de que el TL resuelve problemas de un 
modo muy similar al que muestran los seres humanos cuando tratan con los mismos ca- 
sos. Primero, y quizá lo más importante: es capaz de encontrar pruebas para teoremas y, 
por lo tanto, incorpora un sistema de procesos que resulta suficiente para un mecanismo 
solucionador de problemas. Segundo, su capacidad para resolver un problema particular 
depende de la secuencia en que se le presenten los problemas, de la misma manera como 
la conducta de un sujeto humano depende de una secuencia similar. Tercero, su conducta 
exhibe disposiciones preparatorias y direccionales. Cuarto, muestra discernimiento en el 
sentido del ensayo y error vicarios, que conducen a la solución *“repentina'” de problemas, 
y en el sentido de que emplea la heurística para mantener dentro de límites razonables la 
cantidad total de ensayo y error. Quinto, utiliza conceptos simples para clasificar las ex- 
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presiones con que trata. Sexto, su programa muestra una compleja jerarquía organizada 
de problemas y subproblemas (pág. 162). 


Desde un principio quedó claro que el advenimiento del TL (más específicamen- 
te, de la metodología, objetivos y estrategias comprendidas en el programa del 
TL) anunciaba una nueva época de conceptualización y teorización de los procesos 
mentales complejos, como el pensamiento y la solución de problemas, entre 
otros. Con raras excepciones (por ejemplo, Duncker, 1945; DeGroot, 1946; 
Bruner, Goodnow y Austin, 1956) las anteriores discusiones psicológicas acerca 
del pensamiento y la solución de problemas se habían caracterizado por su va- 
guedad y por un reconocimiento abrumador de lo incompleto e insuficiente de 
cualquier hipótesis particular, mecanismo o teoría que explicara la riqueza de los 
fenómenos. El comportamiento del programa TL constituyó un gran paso en la di- 
rección apropiada: estaba especificado con precisión y de forma completa, y la su- 
ficiencia de sus mecanismos era determinable. Dio lugar a una nueva tecnología de 
construcción de teorías para el estudio de la conducta humana compleja, un 
campo que, como debe recordarse, raras veces fue tocado por los conductistas. 

Desde la época del teórico lógico se han desarrollado muchos otros modelos de 
simulación para numerosas tareas de razonamiento formal: solución de problemas 
de cálculo, construcción de pruebas en geometría, comprensión de problemas ora- 
les de álgebra, descubrimiento de interesantes teoremas en la teoría del número. 
La mayor parte de ellos no se han probado para verificar si simulan directamente 
la manera en que los seres humanos solucionan problemas en esas áreas. Otra le 
nea de investigación acerca de los programas de razonamiento se concentra en 
aquellos que llevan a cabo juegos retadores, un tema que veremos a continuación. 


Jugadores 


La programación de una computadora para juegos de salón —como las damas 0 
el ajedrez— contra un oponente comparte muchas de las características que se en- 
cuentran en los programas que prueban teoremas. La disposición de las piezas en 
el tablero en cualquier momento, constituye los supuestos, y el objetivo es trans- 
formarlos en una posición final victoriosa mediante una secuencia de movimientos 
permitidos por las reglas del juego. Tales movimientos desempeñan el mismo pa- 
pel que las reglas de inferencia en la construcción de argumentos lógicos. Desde 
luego, el programa juega en contra de un adversario que debe considerarse al 
menos tan racional como él. 

La unidad básica del análisis es el movimiento individual. El programa, que tiene 
una representación interna del tablero y de la posición de todas las piezas, prevé 
varios movimientos (mi movimiento, los posibles movimientos del adversario, mi 
siguiente movimiento, los contramovimientos siguientes del oponente, etc.). Al 
alcance de sus previsiones se le denomina profendidad de la búsqueda. El árbol de 
búsqueda de las posibilidades puede hacerse muy prolongado si se tienen en cuen- 
ta múltiples alternativas en cada movimiento. Los programas deben deshacerse 
de muchas de las opciones examinadas en cada movimiento, a costa de la profun- 
didad de la búsqueda a lo largo de ramas particulares del árbol. En general, los 
programas que buscan profundidad entre unas cuantas alternativas prometedoras 
son los que dan lugar a mejores resultados. Se utilizan varias heurísticas para deci- 
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dir qué opciones, uno o dos movimientos adelante, garantizan una búsqueda más 
profunda. 

Una vez que se ha construido un árbol de búsqueda de alternativas en un movi- 
miento dado, el programa debe evaluar las diversas ramas para descubrir su valor 
y decidir su movimiento. Las consecuencias últimas de jugar una partida completa, 
de “ganar, perder o retirarse”, son por lo común demasiado rernotas y muy inde- 
terminadas para que ayuden en la evaluación de un movimiento particular. Por eso 
es necesaria alguna función de evaluación que sea sensible a las submetas en re- 
lación con un movimiento individual y local. Los expertos en el juego casi siempre 
nos proporcionan algunos criterios para evaluaciones locales en tipos particulares 
de juego, como los que se refieren al control del tablero, ventaja de piezas, pro- 
porción de cambio de piezas-rey, contro) de la hilera del fondo, etcétera. En el 
programa de juego de damas de Samuel (1959), la posición de una ficha se evalúa 
al computar un promedio sopesado de los valores de varias de esas características 
locales. Cada hipotética posición generada en el árbol de búsqueda se evalúa de 
esa manera, 

A) tomar una decisión, la máquina selecciona aquel movimiento que posee el va- 
lor más elevado, que se ha calculado mediante un procedimiento hacia atrás 
minimax. En la figura 12.18 se muestra un árbol de búsqueda muy simple que 
implica sólo dos movimientos en cada nivel (a computadora puede considerar de 
10 a 20 movimientos en cada nivel), y una búsqueda que únicamente profundiza en 
tres niveles (mi movimiento, su contramovimiento, mi próximo movimiento). 
Cada nodo del árbo! representa un estado hipotético del juego. En el nivel más 
profundo, a las 8 posiciones anticipadas se les asignan puntos mediante una fun- 
ción de evaluación, donde las puntuaciones altas indican buenas posiciones para 


Mi posición presente 


¿Minimo por +20 


debejo de dos) +7 MI movimienta 


Nueva posición 


[Máximo por 


debajo de dos)” + 100 Su movimiento 


Nueva posición 
MI movimiento 


Nueva posición 
+100 +50 +20 =7 +3 +7 +18 —5 


Figura 12.18. Árbol de búsqueda de profundidad con niveles de tres movimientos, en 
el cual sólo se consideran dos de los movimientos de Cada nivel. Las posiciones al ni- 
vel de la mayor profundidad buscada se anotan evaluando la función. La anotación 
de un nodo al nivel 2 es la máxima de todas las posibles en sus dos ramas más ba- 
jas; la del nivel 1 es la mínima de la anotación en sus dos ramas más bajes. 
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ung mismo. Como yo escogería el movimiento de máxima puntuación en mi segun- 
do movimiento, el valor asignado al nodo de arriba es el mayor de las dos puntua- 
ciones inferiores. En cuanto al movimiento de mi adversario, suponemos que tra- 
taría de mantener mí ganancia al mínimo, de modo que su elección haría que se 
diera el valor mínimo al nodo de arriba. AJ volver a mi posición presente, la rama 
+ 20 sin duda me resulta un mejor movimiento que la rama +7, de modo que ésa 
sería mi elección. 

Este tipo de árbol de búsqueda y el análisis de apoyo minimax se ejecutan en cada 
movimiento del juego. El programa de Samuel para el juego de damas incluye una 
diversidad de características adicionales a fin de mejorar el juego. Varias de ellas 
son rutinas de aprendizaje; una rutina proporciona retroalimentación jugada a juga- 
da y corrección de los pesos asignados a las distintas submetas en la función de 
evaluación; la otra comprende una memoria de repetición (sobre cinta magnética) 
para todas las posiciones del tablero que se encuentren, buscadas y evaluadas pre- 
viamente, Esta memoria móvil ayuda a reducir el árbol de búsqueda a cada paso, a 
sólo aquellas ramas que deban explorarse con mayor profundidad. 

Samuel realizó muchas exploraciones con este programa, ensayando diferentes 
heurísticas y rutinas de aprendizaje de automejoramiento. Se entrenó a la máquina 
haciéndola jugar a las damas con adversarios humanos, y contra partidas de cam- 
peonato publicadas en libros dedicados al juego de damas. El programa mejoró no- 
tablemente su ejecución, al punto de que por lo general derrotaba a su rival humano. 
En 1962 se arregló una partida entre un campeón de damas ya retirado, Robert 
W. Nealey, y el programa, La máquina ganó con facilidad. Al terminar la partida, 
Nealey comentó: 


Nuestro juego ... tuvo sus bemoles. Hasta el movimiento 31, todo se había publicado, 
excepto en donde yo evadí “el libro”” varias veces, en un vano esfuerzo por desincronizar 
a la computadora. En el perdedor 32-27, y de allí en adelante, todo el juego es original 
nuestro, hasta donde pude apreciar. Para rf es muy interesante señalar que la computa- 
dora debió hacer varios movimientos de verdadero campeón a fin de ganar, y que tuve 
varias oportunidades de retirarme. Esa es la razón por la que me sostuve. Por lo tanto, la 
máquina jugó un final perfecto sin dar un mal paso. En lo que concierne al final del juego, 
nunca tove un competidor tal entre los seres humanos desde 1954, cuando perdí mi última 
partida (Feigenbat y Feldman, 1963, pág. 104). 


Desde esa época, Samuel (1967) ha revisado el esquema para la evaluación de 
las posiciones y las rutinas de aprendizaje concomitantes, La función de polinomio 
lineal del trabajo anterior se abandonó en favor de un complejo proceso de eva- 
luación no líneal, que implica refinamientos jerárquicos de evaluaciones bastas de 
muchos subpatrones significantes o agregados de “características” de determi- 
nadas posiciones del tablero. La nueva función de evaluación de posición conduce 
auna considerable mejoría en el juego de damas del programa. 

El programa de Samuel se desempeña bien porque busca lus posibles movimien- 
tos de una forma exhaustiva y profunda, y tiene una manera experimentada de 
evaluar los resultados anticipados. También se han construido programas que jue- 
gan aceptablemente al ajedrez bajo lineamientos similares (Greenblatt et al., 
1967). Aunque estos programas juegan razonablemente, los estudios detallados 
de jugadores expertos en juegos de salón sugieren que éstos invierten mucho me- 
nos tiempo en el examen de una gran variedad de opciones, y que reconocen con 
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facilidad porciones de la configuración del tablero que parecen prometedoras. 
Pasan entonces mucho tiempo analizando posibles secuencias de movimientos 
dentro de estas porciones significativas. La investigación de Chase y Simon (1973) 
con jugadores de ajedrez, y la de J. S. Rejtman (1976) con maestros del juego ja- 
ponés del Go han descubierto que los expertos son mucho mejores que las nava- 
tos para percibir configuraciones significativas de las piezas en el tablero (como la 
de “su alfil está atacando a mi teina'”). Estos investigadores sugieren que me- 
diante la experiencia en miles de juegos, los maestros han construido en su memo- 
ría un gran almacen de patrones significativos de ajedrez (o de Go) que actúan 
como bloques: grandes unidades para percibir y pensar acerca del juego y su desa- 
rrollo desde un punto de vista dado; también pueden recordar qué bloques (partes 
de la configuración del tablero) han prometido desarrollos fructíferos en el pasado. 
La percepción del maestro de ajedrez de un tablero se ha comparado con la forma 
en que un lector experimentado reconoce-las palabras como bloques de letras en 
hileras. Para simular la percepción del jugador de ajedrez, Simon y Barenfeld 
(1969) elaboraron un programa de computadora que explora con sus ojos (hipoté- 
ticos) las piezas dispuestas en un tablero de ajedrez, para notar configuraciones 
significativas de las mismas, pasar un tiempo mirando los patrones importantes 
(corno lo hacen los jugadores humanos), y entonces representarse a sí misma la si- 
tuación real del tablero en términos de bloques de patrones significativos. De 
modo similar, W. Reitman y Wilcox (1978) han puesto en marcha un sistema de 
reconocimiento de patrón y de inferencia que juega al Go con un rango respetable 
de aficionado. La importancia de estos últimos estudios estriba en mostrar que el 
impulso inicial de usar el poder de la computadora para buscar exhaustivamente 
los movimientos del juego, era un enfoque desafortunado; más bien, la destreza 
parece residir en la habilidad del maestro para percibir o reconocer cientos de pa- 
trones familiares, y para agregar bloques de un nivel a otro superior, a fin de acti- 
var una estrategia dada, buscando movimientos desde la posición real del table- 
ro, El maestro de ajedrez y el maestro de Go representan órdenes elevados de 
aprendizaje perceptual dentro de un dominio restringido. 


El solucionador general de problemas 


Uno de los más ambiciosos programas de investigación acerca de la solución 
mecánica de problemas es el solucionador general de problemas (SGP), de Newell, 
Shaw y Simon (1959); Newell y Simon (1961). El SGP es un proyecto continuo: 
desde su concepción en 1957, el programa ha existido en siete diferentes versio- 
nes de operación, cada una de las cuales estaba diseñada para manejar un conjunto 
ligeramente distinto de dificultades. Las versiones útiles aparecen en los libros de 
Emast y Newell (1969), y Newell y Simon (1972). El SGP intentaba ser un con- 
júnto central de procesos que pudieran trabajar con —y resolver— una variedad 
de problemas que implicaban diferentes materias de estudio, como las de probar 
teoremas en lógica, comprobar identidades trigonométricas y resolver acertijos 
de palabras. Al disponer su operación sobre cualquier problema particular, ha de 
proporcionarse un “ambiente de la tarea”, a fin de especificar a la máquina los 
objetos a que se va a enirentar y las reglas de transformación (movimientos) del 
juego en particular. 

Las premisas y la meta deben estipularse en términos comparables, de modo 
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que el SGP pase a transformar las premisas (o puntos de partida) en la meta, Usa 
análisis de medios y fines genera subproblemas con los cuales trabajar, y cons- 
truye un árbol de subproblemas. Hay rutinas generales para comparar dos expre- 
siones y detectar diferencias entre ellas. Si se detectan diferencias, el SGP busca 
entonces alguna transformación que las reduzca. En la figura 12,19 se proporciona 
un sumario de tres metas (o submetas) y Jos métodos asociados que el SGP utiliza 
para trabajar en ellos, Las metas a menudo aparecen de modo repetitivo dentro de 
un circuito. Comenzando con la meta de transformar el objeto A (premisa) en el 
objeto B (conclusión), el programa puede encontrar una o más diferencias. De ser 
así, establece como meta reducir la diferencia más importante. De aquí se pasa al 


Mate tr ensformer el objeto A en el objeto B 


Comparer A con B 
Encontrar la dilerencie D más 
Importente 


PSubmeto: : : Submeta: 
kReducir le dlfterencio DE Transtormer A en 8 


Metal ll: Reducir la diferencie D entre el Sulsio A Y el caes B 
uscar el operedor E Submeta: 


Que venga el caso 3 
Para reducir O Aplicer A 


Mela 11): Aplicar el operador Q aj objeto A 


omparer A con las condiciones de Q 
Encontrer la diferencia 0” 
más importente 


Submeta A Submeta: ' 
ducir la diferencie PD; e Aplicer Qe A” 


Figura 12.19, Resumen de las metas primordiales y de Jos métodos $SCP asociados 
que se emplean para lograrlas. La meta de transformar el objeto A en el objeto B con- 
duce a la submeta de reducir una o más diferencias entre ellos. Para reducir una dife- 
rencia dada, se encuentra un operador pertinente. La siguiente submeta consiste en 
aplicar el operador a A. Si no es posible hacerlo, la siguiente submeta es determinar 
en qué difiere Á de las cosas a las que puede aplicarse el operador En este punto, la 
secuencia se repite a distinto nivel (tomada de R.F Creen, jr, 1963). 
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objetivo de hallar un operador (transformación permisible) que pueda aplicarse a 
las premisas. Si no puede aplicarse, entonces ve si A puede transformarse en algo 
alo cual pueda aplicarse el primer operador. Parte del ambiente de la tarea sumi- 
nistrado al SGP junto con el problema es una tabla de diferencia de operadores 
que proporciona las transformaciones, permisibles y propias del caso, para reducir 
formas particulares de diferencias. 

Como la persecución de cada meta conduce con frecuencia a la proliferación de 
submetas dentro de las submetas, el programa SGP tiene una rutina ejecutiva que 
supervisa la generación de nuevas submetas, las evalúa con criterios múltiples y 
luego las descarta o decide en qué orden debe trabajar con ellas. 

El SGP implica considerablemente más procesos y heurísticas de lo que esta 
breve descripción puede abarcar. Por supuesto, prueba teoremas. Tal vez de 
mayor interés para los psicólogos sea el intento de Newell y Simon (1972) de ajus- 
tar protocolos de ' “pensamiento en voz alta”, obtenidos de sujetos que se enfrentan 
a problemas de lógica y los resuelven por primera vez, sin otra ayuda que un 
adiestramiento mínimo en las reglas del juego. Al sujeto se le pide que piense en 
voz alta, que diga lo que está buscando o considerando en cada paso de su camino 
mientras prueba un teorema. De modo similar, se imprimen los funcionamientos 
internos (razonamientos) de la computadora mientras procede paso a paso a resol- 
ver el problema. A) analizar diversos protocolos, los autores señalan un número 
de similitudes en lo que el programa y el sujeto hacen en varios puntos, a lo largo 
de la construcción de la prueba. Newell y Simon concluyen que el comportamiento 
del programa paso a paso es una simulación bastante exacta de algunas de las ca- 
racterísticas significativas de la salida verbal del sujeto y la secuencia de selección 
de reglas. 

Sin embargo, es obvio que el solucionador general de problemas está todavía 
muy lejos de lograr las capacidades generales de los seres humanos adultos. 
Necesita que se le describa la meta exactamente en los mismos términos de un 
problema. A partir de esta descripción, intenta transformar el supuesto en la 
meta, Desde luego, esto constituye una restricción de la clase de problemas que 
puede intentar resolver. Por ejemplo, las tareas de determinación de series de le- 
tras tienen metas que no pueden describirse de esta manera, y es evidente que el 
SGP no podrá manejar estos u otros problemas similares. En suma, el SGP no 
opera con problemas mal definidos, en los cuales la meta no está correctamente 
especificada (por ejemplo, escribir una historia de suspenso). 


Proyectos de robots 


Quizá para los psicólogos sean de gran interés los proyectos de robats integrados 
que se han desarrollado en Stanford, MIT, y el Stanford Research Institute (SRI) 
durante la última década. A) parecer, el robot SRI es el más ambicioso de todos 
ellos (Fikes y Nilsson, 1971). Consiste en una carreta movida por un motor, con: 


1. una cámara de televisión para captar una imagen visual de su ambiente, un 
telémetro para triangular la distancia a cualquier punto del robot, y una ““punta 
buscadora'”” que actúa como un sensor táctil; todos estos dispositivos transmiten 
información aferente o sensorial a: 
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2. una computadora que mantiene una variedad de programas para analizar la 
información aferente, planear las secuencias de acción que producirán ciertos 
efectos sobre su ambiente real, y 

3. un conjunto de motores que pueden darle vuelta al carro, moverlo hacia ade- 
lante o hacia atrás, y un conjunto de amortiguadores que pueden usarse para em- 
pujar cajas y otros objetos sobre un piso plano. 


El ambiente rea) proporciona un rico campo para el aprendizaje y es una fuente 
de problemas que pueden plantearse al robot para que los solucione, así como un 
fantástico número de problemas de ingeniería que los diseñadores deben resolver. 
Consideremos uno para ilustrar la naturaleza del sistema. 

En la figura 12,20 se muestra el esquema de un ambiente de cinco habitaciones 
interconectadas con el robot en la habitación 1, con tres cajas y un interruptor de 
luz, Un primer problema consiste en representar en la memoria del robot la ínfor- 
mación concerniente a la disposición espacial de su ambiente. Parte de ella es in- 
formación relativamente permanente; por ejemplo, en dónde están las puertas y 
qué habitaciones se comunican con cuáles otras. En esta información permanente 
se incluyen también ciertas leyes físicas acerca del ambiente (que un objeto colo- 
cado en un lugar no está en otro lugar) y reglas de movimiento (el robot no puede 
pasar por encima de una caja sin moverla, o no puede entrar a una habitación cru- 
zando las paredes de ladrillos, etc.). Parte de la información en la memoría es 
transitoria, como la ubicación presente del robot y de las cajas. Esta información 
se adquiere mediante la cámara de televisión, cuyas imágenes son examinadas por 
programas de análisis de escena algo complicados (Fenenbaum y Barrow, 1976). 

Se dice que el resultado de este análisis transitorio, junto con los datos estables 
acerca del ambiente, comprenden el modelo actual del robot acerca de su mundo, 
que se denomina M,, (por modelo inicial). En aras de la conveniencia, estos hechos 


HABITACIÓN 1] HABITACIÓN 2/HABITACIÓN 3]HABITACIÓN 4 


ACAJA 1 
BCAJA 2 
INTERRUPTOR 
DE LUZ OD 
CCAJA 3 
PUER- PUER- p——Puen- 
TA 1 TA 2 TA 3 


HABITACIÓN 5 


Figura 12.20. Plan de la habitación para el robot $K/ (tomada de Fikes y Nilsson, 
1971) 
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se representan en términos de enunciados en el cálculo predicado de lógica. Así, 
por ejemplo, el modelo inicial (yéase la figura 12.20) incluiría las siguientes enun- 
ciaciones acerca de las ubicaciones de los objetos: 


ATR (e) 
$ AT (caja 1, 4) 1 
| AT (caja 2, B) / 
AT (caja 3, C) 


Mo; 


Estas enunciaciones significan que el robot se encuentra en el punto e, la caja 
1 se localiza en el punto A, y así sucesivamente. Supongase que se da ahora al rohot 
el problema de recoger las tres cajas. La meta se traduce en una enunciación en el 
cálculo predicado, para encontrar una ubicación x tal que, las tres cajas se encuen- 
trén en x. Un programa de solución de problema llamado STRIPS es el compo- 
nente que en realidad planea Ja secuencia de operadores (pasos u “Órdenes moto- 
ras”) que el robot debe ejecutar para lograr el objetivo. El STRIPS opera de 
modo parecido al SGP, usando principalmente las heurísticas de medios y fines 
(para reducir diferencias), a excepción de que posee mayor capacidad deductiva 
que éste. Comenzando a partir de su modelo actual del mundo, M,. el STRIPS 
busca una secuencia de operadores que produzcan un modelo nuevo dentro del 
cual la enunciación de la meta sea verdadera. Para el robot, los operadores corres- 
ponden a netinas de acción, cuya ejecución hace que él emprenda ciertas acciones. 
AJgunas de las rutinas asequibles al SR] son las siguientes (considérense las cons- 
tantes de la ubicación como vectores bidimensionales): 


a) Ir ar(m): el robot va a la ubicación coordinada +1; 

d) Ir a, (m): el robot va a continuación al reactivo +; 

e) Empujar a (2, 1): el robot empuja el objeto + junto al reactivo a; 

dí Encender la luz (mm): el robot acciona el interruptor de luz ze; 

e) Trepar sobre la caja (sm); el robot se sube a la caja e; 

/) Bajar de la caja (257): el robot se baja de la caja ma; 

8) Pasar por la puerta (d, »a, +3): el robot pasa por la puerta d de la habitación 21 a la ha- 
bitación ». 


Cada uno de estos operadores tiene un conjunto de precondiciones que deben 
ser verdaderas en lo que respecta al modelo del mundo antes de que puedan apli- 
carse. Por ejemplo, las condiciones previas de bajarse de la caja (m) son que m 
sea una caja y que el robot se encuentre encima de sm. Asimismo, la ejecución de 
una acción hace que el modelo del mundo cambie; estas vartaciones se manejan 
mediante una lísta de sema y una lista de supresión que corresponden a cada ac- 
ción. La lista de suma proporciona los hechos nuevos que se hacen realidad por el 
electo de la acción sobre el mundo, mientras que la lista de supresión da los he- 
chos anteriormente verdaderos que se han cancelado por el efecta de la acción. 
Dos ejemplos simples de estas listas para operadores son los siguientes: 


1. Empujer (k, m, 12): el robot empuja el objeto k del lugar » al lugar 4 


condición previa: AT (k, m): el objeto k está en el lugar m 
ATR (m): robot en el lugar 2 
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lista de suma: AT (k, n): objeto k en lugar 
ATR (n): robot en lugar » 

lista de supre- 

sión: AT (k, m): objeto k en lugar 922 


ATR (m): robot en lugar m 
2. Ira (m, nm): el robot va del lugar » al lugar » 


condición previa: ATR (sa): robot en el lugar 1 
lista de suma: ATR (11): robot en el lugar n 
lista de 

supresión: ATR (1): robot en el lugar m 


El STRIPS emplea un probador de teorema para intentar demostrar que la 
meta se deriva del modelo inicial del mundo, Mo. Si no puede hacerlo de una vez, 
al igual que el SGP extrae de la prueba incompleta la diferencia entre Mo y la 
meta, y busca un operador pertinente que reduzca esta diferencia. Si encuentra 
uno, se establece una submeta para probar que las condiciones previas de ese 
operador (lo que debe ser verdadero para que se aplique) se cumplen en el modelo 
actual del mundo. De ser así, se aplica el operador, las listas de suma y supresión 
de ese operador actualizan el modelo (para M), y el siguiente paso es verificar si 
M, satisface la meta. Si no, el programa toma la diferencia y aplica de nuevo la 
misma rutina, una y otra vez de manera repetitiva. Si el modelo actual del mundo 
no satisface la condición previa de un operador deseado, se establece una submeta 
para encontrar un operador aplicable que implica un modelo que satisfará las con- 
diciones previas. Por supuesto, éste es el mismo tipo de subproblema que el pro- 
blema global, e ilustra la jerarquía de metas, submetas y modelos que pueden ser 
generados por el proceso de búsqueda. El STRIPS evalúa continuaciones o líneas 
particulares de búsqueda, al tener en cuenta factores tales como el número de 
submetas que quedan por resolver, la complejidad de las diferencias entre los 
tipos de predicados de estas submetas; finalmente, selecciona aquella línea de 
búsqueda que posee la mejor evaluación, 

Para regresar al problema inicial, se ha instruido al robot para que empuje las 
tres cajas (o se le ha dado otra meta que requiere de ésta como submeta). Podría 
determinar primero el empujar la caja 1 del lugar 4 al lugar B, cerca de la caja 2. 
Pero una condición previa para un operador de Empujar (caja 1, A, B) es que el 
robot se encuentre en el lugar 4, de modo que debe usarse un operador [r A, (caja 
1) para satisfacer esta condición previa, Al haberse colocado detrás de la caja 1 y 
empujarla a la caja 2, el robot entonces aplica una secuencia de operador similar 
para empujar la caja 3 a la caja 2, con lo cual logra su meta. Aunque esta descrip- 
ción es muy breve, la cantidad de búsqueda de gráfica de problema que efectúa el 
robot (computadora) para lograr su objetivo es bastante amplia. Pero debe recor- 
darse que en su ejecución inicial de tales tareas el robot es muy semejante a un ni- 
ño no educado, 

Una vez que ha realizado varias veces esa y otras tareas similares, habrá aprendido 
una subrutina bastante general para recoger diversos objetos. La subrutina, un tanto 
parecida a una humana, se generalizaría a particulares tales como cuántos objetos 
han de recogerse, qué son los objetos y dónde están ubicados en relación con la 
posición inicial del robot. Fikes, Hart y Nilsson (1972) han investigado cómo ge- 
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neralizar o abstraer secuencias exitosas de acción lejos de particulares irrelevan- 
tes, mientras se capturan las variables importantes en cada caso. Por ejemplo, si 
un objeto está fijo, como el interruptor de luz en la figura 12.20, la pila de los 
objetos debe recogerse alrededor del objeto inmóvil. 

El robot SR] se ha probado en una gran diversidad de áreas, los programas se 
han revisado en tareas más difíciles, y así sucesivamente en continuos ciclos de 
perfeccionamiento. El robot resuelve un cierto número de problemas; por ejem- 
plo, y para enumerar algunos referidos a los arreglos de la figura 12.20: puede ir a 
una ubicación fijada en la otra habitación; puede apartar cualquier caja que bloquee 
el paso en una puerta; puede dirigirse a una habitación determinada y empujar una 
caja desde allí hasta otra habitación; accionar el interruptor de la luz al mover la 
caja más alta y colocarla debajo de aquél, subirse a ella, etcétera. Está en posi- 
bilidad de ejecutar una sorprendente variedad de acciones electivas, y sus capaci- 
dades están en expansión. Se ha realizado una película interesante e instructiva 
acerca del proyecto SRÍ, que ilustra la variedad de problemas que el robot solu- 
ciona, y proporciona una explicación de las rutinas de análisis de escena y de la pla- 
neación que lleva a cabo el programa STRIPS. Este proyecto y los proyectos 
*mano-ojo”* en MIT y en la Universidad Stanford se han mostrado muy activos al 
proponer problemas sustantivos y al lograr reveladores resultados en el campo de 
la inteligencia artificial. 

Estos proyectos de robots son interesantes para los especialistas del aprendi- 
zaje porque atacan la totalidad de los problemas de la psicología en una empresa in- 
tegrada: el robot debe aprender a ver, a clasificar objetos, a moverse y a girar; 
aprender secuencias de movimientos, aprender un mapa cognoscitivo de su am- 
hiente, planear y ejecutar acciones eficientes dirigidas a una meta, y aprender a 
generalizar un grupo de secuencias de acción que tienen un objetivo común. Todo 
esto se desarrolla en un ambiente casi real. Una teoría fructífera del aprendizaje 
debe ayudar en la síntesis de ese robot de propósitos generales, 


Planeadores inteligentes 


Como solucionadores de problemas, el STRIPS y el SGP son toscos; para re- 
solver un problema deben investigar un plan dado en sus detalles más minuciosos. 
Por ejemplo, si se le pide que decida si usted puede ir a ver una película esta 
noche, el STRIPS tendría que preocuparse por si usted es capaz de meter la 
mano en el bolsillo para sacar el dinero o si sus ojos operan de la manera apropia- 
da. Antes de enfrascarse en los tediosos detalles de un intento específico de solu- 
ción, ninguno de esos dos programas produce una estrategia global del problema. 
Si hay muchas acciones aplicables (operadores), cada una con múltiples condicio- 
nes previas, la búsqueda se obstruye muy pronto. Lo que se necesita es un dispo- 
sitivo que permita planear una solución a niveles más generales de abstracción, ig- 
norando todos los detalles estándar, y atendiendo sólo a las condiciones previas 
esenciales, Un programa de Sacerdoti (1974) llamado ABSTRIPS (por STRIPS 
abstracto) construye los planes de acción del robot exactamente de esta forma. 
Las condiciones previas de un operador de acción pueden ordenarse por rango en 
términos de su probabilidad de ser un problema; asf, en nuestro ejemplo del cine, 
tener dinero para comprar el boleto se consideraría más problemático que el ser uno ca- 
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paz de sacarlo del bolsillo. El plan inicial del ABSTRIPS se formula exactamente 
para ocuparse de las condiciones previas más críticas para las acciones necesarias. 
Si tiene éxito en esto, utiliza dicho plan inicial como una estructura sobre la cual 
arma los subplanes diseñados para lograr aquellas condiciones previas (de las ac- 
ciones en niveles de importancia sucesivamente inferiores). Ésta parece una Si- 
mulación más real de la tendencia humana de planear a un nivel general, antes de 
preocuparse por los detalles. 

El ABSTRIPS funciona muy bien con problemas para los cuales las submetas se 
logran independientemente, sin interacción, de modo que el problema global se 
soluciona agregando las contribuciones parciales. Desafortunadamente, muchos 
problemas reales no son aditivos en el sentido de que una submeta repercuta 
sobre una condición previa para otra submeta, o la impida. Un ejemplo se da cuan- 
do usted tiene dinero para adquirir una entrada para el cine, pero no el suficiente 
como para comprar un boleto de autobús y otro para el cine. Otro ejermplo se 
muestra en la figura 12,21: el estado inicial de las tres cajas es que la caja C se api- 
la sobre la caja A y la B está sola. El estado meta a lograr es una pila con A en la 
cúspide, después B y por último € en la parte inferior. Las submetas estándar 
para un programa podrían ser colocar la caja B sobre la C, y A sobre B. Pero si el 
programa opera en cualquiera de estas submetas primeramente y par separado, la 
manera más directa de lograr alguna de las submetas evita la posibilidad de alcan- 
zar la otra submeta sin un apoyo. (Por ejemplo, la submeta 2 sobre C podría 
lograrse directamente desde el estado inicial, pero eso deja a Á en el lugar equivoca: 
do.) Sacerdoti (1975) ha programado un solucionador más perfeccionado que re- 
suelve problemas no lineales atendiendo a las interacciones entre las submetas y 
solucionando conflictos entre metas. Por ejemplo, el programa observa si una ac- 
ción da lugar a un estado que impida la ocurrencia de otra acción necesaria. Si sus 
submetas son pintar el cielo raso y la escalera, observará que pintar primero la es- 
calera la dejará imitil para poder pintar el cielo raso, de modo que el programa or- 
dena a las submetas que traten con esto. Con muchas de tales elaboraciones, el 
programa de Sacerdoti logró solucionar un rango de retadores problemas no 
lineales. Fahlman (1974) también ha diseñado un planeador inteligente para resol- 
ver problemas no lineales en las construcciones geométricas. Aunque estos pro- 
gramas parecen sumamente valiosos para las pruebas psicológicas, en la actualidad 
no hay comparaciones minuciosas de las predicciones de estas teorías planeadas 
con detalle observados de la conducta humana de solución de problemas. Un 
principio de tales comparaciones se encuentra en el trabajo de B. Hayes-Roth y F. 
Hayes-Roth (1979) acerca de la manera en que los seres humanos planean un día 

vimientos sin deshacer ninguna 


A | B le 
acción. El problema tiene subme- 


Estado Inicial Estado meta tas nc lineales. 


Figura 12.21. £l problema consis- 
te en transformar el estado ini- 
cial en el estado meta en tres mo- 
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de trabajos esporádicos y diligencias antes de ir a la ciudad. Cabe esperar que las 
observaciones de la planeación cotidiana se conviertan en un área de mayor interés 
para el estudio psicológico. 


ESPECIALISTAS EN EL CONOCIMIENTO 


Los esfuerzos anteriores (SGP. STRIPS y ABSTRIPS) exploran razonamien- 
tos poderosos o métodos de sohución de problemas, pero éstos son muy genera- 
les. Así, Newell y Simon creen que el análisis de medios y fines tiene la generalidad 
suficiente como para surgir en múltiples dominios, ya sea al probar teoremas lógi- 
cos, al encontrar un camino para llegar a casa, o al resolver rompecabezas o acer- 
tijos. Una tendencia contraria que se ha popularizado en el campo de la inteligencia 
artificial, se ciñe al punto de vista de que la solución de problemas raras veces es 
una habilidad general, que un solucionador experto se desempeña con eficiencia en 
su especialidad porque posee un gran caudal de conocimientos acerca de proble- 
mas específicos en ese dominio, en lugar de disponer de un método de razona- 
miento considerablemente eficaz. Esta visión se sugirió en los estudios de Chase 
y Simon (1973) acerca de las habilidades de reconocimiento de patrón de los maes- 
tros de ajedrez. Desde esta perspectiva, la manera de simular la solución de pro- 
blemas consiste en escoger un problema aplicado (como un diagnóstico médico), 
obtener de un especialista los conocimientos pertinentes que posee, escribirlos en 
el programa como un conjunto de reglas para clasificar casos específicos, y dejar 
que el programa intente clasificar algunos. Á continuación se analizan los errores 
del prograrna, se agregan algunas reglas o patrones, se especializan otros, y se vuelve 
a recorrer el ciclo a través de las fases de probar y después evaluar. A la postre, con 
la ayuda de varios especialistas, la experiencia con los casos de prueba, y el inge- 
nio teórico para mejorar y sintetizar múltiples fuentes de evidencia, uno debe 
desarrollar un solucionador de problemas bastante eficiente en un dominio es- 
pecífico. 

Exactamente esta estrategia es la que han seguido E. A. Feigenbaum y sus 
colaboradores en el Proyecto de programación heurística (Heuristic Programming 
Project) de la Universidad Stanford (Feigenbaum, 1978). Con la ayuda de expertos, 
estos científicos de la computación desarrollaron y revisaron programas que resuelven 
problemas difíciles, en un número de dominios específicos. Un programa (PUFF) 
efectúa diagnósticos de pacientes con posibles desórdenes pulmonares. La entra- 
da al programa consiste en una serie de exámenes médicos y mediciones que 
incluyen, por ejemplo, la tasa y el volumen de la corriente de aire cuando el pa- 
ciente respira por un tubo. Asimismo, se tienen en cuenta datos importantes de su 
historia clinica, como su edad y la cantidad de cigarrillos que fuma. El PUFF con- 
sidera tales datos y elabora un diagnóstico que especifica si los pulmones o las vías 
respiratorias son normales o si están restringidos, y señala el probable tipo de en- 
fermedad (como bronquitis o enfisema). El programa elabora su diagnóstico clasi- 
ficando las numerosas mediciones de entrada en varias fases, usando alrededor de 
55 reglas de SI. ENTONCES reunidas por expertos. Las reglas estipulan básica- 
mente que sí se obtiene un cierto patrón de mediciones médicas, entonces se justi- 
fican ciertas deducciones y consejos. Las reglas de inferencia pueden disponerse 
en una red para arribar a una conclusión en etapas. Por ejemplo, algunas medi- 
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ciones médicas iniciales pueden sugerir la necesidad de tomar otras antes de que 
proceda el diagnóstico. Las 55 reglas en el PUFF se lograron con la ayuda de un 
fisiólogo pulmonar y un científico de computación que estudiaron cerca de 100 pa- 
cientes, algunos normales y otros con diversos desórdenes; el fisiólogo debía ex- 
plicar verbalmente las numerosas fuentes de información que consideró y las 
reglas de inferencia probabilística que se utilizaron. Después del conjunto de en- 
trenamiento de 100 casos, el PUFF fue “comprobado”” al comparar sus diag- 
nósticos con los de fisiólogos expertos en 150 nuevos casos. El consenso fue de 
90 a 100%, según la severidad de los criterios para la igualación. Esa fue una eje- 
cución impresionante, ya que el programa igualó diagnósticos de médicos clínicos 
experimentados en un ambiente de tara difícil. 

Otro programa ''experto”” exitoso es el MYCIN (Shortliffe, 1976), que diag- 
nostica infecciones en la sangre y meningitis, y prescribe los tratamientos adecua- 
dos, por lo cual es un buen auxiliar para el médico. Al igual que en el PUFF, el 
conocimiento del MYCIN está contenido en un gran número de reglas que sugie- 
ren relaciones probabilisticas entre un conjunto de síntomas y una enfermedad. 
Una regla típica es la siguiente: 


St: 1. el lugar del cultivo es la sangre, y, 
2. el colorante del organismo es gramnegativo, y 
3. la morfología del organismo es de bastoncillo, y 
4. elpaciente es el huésped 


Entonces: hay evidencia que sugiere (0.6) que la identidad del organismo es 
Pseudomonas aeruginosa. 


Tales reglas se elaboraron con la ayuda de médicos patólogos y cada una tiene 
un “factor de certeza” vinculado a ella, El programa MYCIN intenta rastrear ha- 
cia atrás las cadenas de inferencias a partir de varias enfermedades bacterianas 
hasta los síntomas médicos observados, y calcular la fuerza o probable validez de 
cada cadena de razonamiento. El programa puede identificar varias bacterias ofen- 
sivas y prescribir los medicamentos para cada caso, así como imprimir la cadena 
de razonamientos que conducen a cada conclusión. La huella permite al tutor del 
programa agregar o modificar las reglas, cuaúdo el programa se acerque a decisio- 
nes inadecuadas. Después de entrar al MYCIN con muchos casos, sus deci- 
siones en un nuevo conjunto se juzgaron tan acertadas como las de los expertos en 
el 90% de los casos. 

El proyecto más impresionante del grupo de Feigenbaum es el DENDRAL y su 
complemento, el META-DENDRAL, Se trata de un programa que enumera las 
estructuras moleculares de compuestos químicos que pueden haber causado un 
espectrograma específico. Un espectrógrafo de masa dispara una lluyia de elec- 
trones sobre un compuesto, y hace que las moléculas se rompan en vínculos par- 
ticulares; este procedimiento origina fragmentos que tienen una cierta masa o 
peso molecular. El espectrograma de masa es una gráfica de barra de la abundan- 
cia relativa de cada fragmento molecular, trazada en comparación con la masa de 
fragmento. A partir de esos datos y de uma teoría de la forma en que las moléculas 
se descomponen en fragmentos, un químico hábil puede adelantar una adecuada 
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conjetura acerca de la estructura molecular del compuesto desconocido. El DEN- 
DRAL se diseñó para simular la hipótesis educativa de ese químico. De la química 
se obtuvo un elevado número de reglas de fragmentación, las cuales pudieron pro- 
barse. La regla típica muestra cómo un compuesto particular, caracterizado par 
una estructura molecular específica, es propenso a separarse. Una regla simple 
para un átomo de nitrógeno vinculado con una cadena de tres átomos de carbono 
es la siguiente: 


(N-C—C-C) =N—C/C—C 


donde la ruptura se indica por el corte, y el fragmento N-C a la izquierda tendría 
su masa registrada, Esta regla se aplica a diversos lugares en una molécula grande. 

Usando el espectograma de masa como datos de entrada, una parte del DEN- 
DRAL genera un gran conjunto de estructuras moleculares particulares; entonces 
utiliza su conocimiento de los datos y las restricciones específicas, mediante las 
reglas de fragmentación, a fin de reducir el número de estructuras admisibles. 
Cada estructura que permanece se evalúa simulando el espectrograma que produ- 
ciría y comparándolo con el observado, Después de evaluar de este modo un con- 
junto pequeño de estructuras plausibles, el DENDRAL imprime una clasificación 
de las cuatro o cinco estructuras moleculares superiores para la molécula desco- 
nocida. El DENDRAL se hz programado apenas con las reglas suficientes para 
tratar con clases limitadas de compuestos químicos (aquellos de interés especial 
para los diseñadores). Dentro de ese campo, su ejecución al interpretar espec- 
trogramas suele ser más rápida y exacta que la ejecución humana experta, lo que 
constituye un logro en verdad notable, 

Al perfeccionar el programa DENDRAL para tratar con casos nuevos, muchas 
veces los químicos se vieron obligados a volver a pensar o a conjeturar nuevas 
restricciones acerca de la fragmentación o la múgración del átomo a lo largo de 
fragmentos; al hacerlo, lograron algunos descubrimientos en la química teórica. 
Como desarrollo posterior, el META-DENDRAL se diseñó para integrar sus 
propias reglas de fragmentación molecular, e intentar la explicación de un conjunto 
de datos básicos, pareando las estructuras moleculares conocidas con sus espec- 
trogramas de masa. Para limitar la búsqueda de reglas útiles, desde el comienzo 
se estipuló un conjunto débil de restricciones, incluyendo, por ejemplo, aquellas 
que establecen que los vínculos dobles y triples no se separan, que sólo los frag- 
mentos mayores que dos átomos de carbono aparecen en los datos, etcétera. 
Dado un par molécula-espectrograma (alrededor de 100 números de masa), el ME- 
TA-DENDRAL generaría reglas para separar esa molécula a fin de producir el 
espectrograma; entonces las comprobaría y revisaría, a medida que trata con más 
y más pares. A la postre establecería un conjunto coherente y muy predictivo de 
reglas de fragmentación; en realidad, muchas de las que los expertos han sugerido 
en la construcción del DENDRAL. Cuando empezó a analizar los espectrogramas 
de una nueva familia de moléculas anilladas complejas, para las cuales la teoría es- 
pectral de la masa aún no se había desarrollado, el META-DENDRAL descubrió 
conjunto de reglas para cada subfamilia química. Además, los expertos juzgaron a 
los conjuntos de reglas como científicamente válidos, y esos conjuntos han entra- 
do al campo de la química teórica (para un sumario, véase Buchanan y Mitchel, 
1978). 
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El META-DENDRAL es un “aprendiz” en el sentido más creativo del concep- 
to. Á partir de restricciones relativamente débiles de las reglas que busca, induce 
unas más específicas mediante el uso de datos en un ciclo de “'generar-probar- 
evaluar-perfeccionar”, mejorando y modificando progresivamente sus reglas de 
fragmentación. Los diseñadores del programa no sabían con antelación exacta- 
mente qué reglas descubriría el programa. El hecho de que el META-DENDRAL 
se enseñara a sí mismo a ser un experto nos demuestra cómo los datos de entra- 
da pueden restringir la clase de teorías aceptables. Su éxito también nos habla 
acerca de la eficiencia de los mecanismos de generación y evaluación de reglas. 

El éxito práctico de tales proyectos de ingeniería del conocimiento sugiere que 
la maestría se basa en un gran volumen de conocimientos relevantes que se orga- 
nizan para un uso eficiente, y no necesariamente en métodos profundos de razo- 
namiento. Ninguno de los solucionadores de problemas de propósito general como 
el SGP o el STRIPS tiene esperanzas de alcanzar el éxito del MYCIN o del DEN. 
DRAL. Por supuesto, sus diseñadores tenfan en mente diferentes objetivos. 

Estos programas especializados se escriben como sistemas de inferencias basa- 
dos en reglas. Su conocimiento de operación está contenido en un gran número de 
reglas SL ENTONCES llamadas producciones, las cuales establecen que si surgen 
algunas condiciones antecedentes, entonces pueden emprenderse ciertas 
acciones o decisiones consecuentes. Las producciones son similares a los pares 
de estímulo-respuesta, a excepción de que la condición de estímulo puede ser un 
patsón complejo, y la acción una serie de acciones internas o cambios de estado, 
así como respuestas manifiestas. Las producciones también pueden contener va- 
riables y funciones (por ejemplo, “*si la edad es inferior de 30 años””), mientras 
que el eslabón E-R no se concebía en un sentido tan general. 

Muchas teorías recientes de la simulación están escritas como sistemas de pro- 
ducciones. La idea básica es que en la memoria de largo plazo exista un conjunto 
de reglas (pares de situación-acción), que los datos entren en la memoria de corto 
plazo, y estos datos activos seleccionen y causen el disparo de ciertas produc- 
ciones, tal vez para dar lugar a respuestas externas o a la adición de nuevos datos 
a la memoria de corto plazo. El sistema recorre una serie de ciclos de reconoci- 
miento-acción, mediante lo cual alguna producción reconoce los datos y dispara 
una acción, que inicia el siguiente ciclo, y así sucesivamente. El modelo parece 
apropiado para tratar con los flujos de pensamiento o con las secuencias de la con- 
ducta, donde el contexto más el eyento de la última idea (o dato de acción) activa la 
asociación al siguiente pensamiento o acción. Al parecer, las producciones consti- 
tuyen una forma natural de representar y modelar procedimientos mentales como 
el de sumar dos números de tres dígitos. También proporciona un medio para ex- 
plicar los procesos que sustentan los modos habituales de pensamiento que se ob- 
servan en pacientes deprimidos o paranoicos. En trabajos independientes, Newell 
(1973) y J. R. Anderson (1976) opinan que los sistemas de producción forman un 
medio natural para los modelos de procesos cognoscitivos. 


PROGRAMAS DE PROCESAMIENTO DEL LENGUAJE 


Los seres humanos no adquieren la mayor parte de su información útil mediante 
la acción, sino porque se les dice. Una parte cunsiderable de la enseñanza se basa 
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en impartir información a través de la instrucción. Nuestros conocimientos de los 
asuntos cotidianos en gran medida provienen de leer o escuchar noticias, o de oír 
rumores. El medio que permite todo este aprendizaje es el lenguaje; por consi- 
guiente, los psicólogos que estudian el aprendizaje deberían interesarse en los de- 
talles de la forma en que la gente aprende a partir de las cosas que se dicen. Se ha 
afirmado que una capacidad de los seres humanos que los diferencia de otros 
animales es su competencia en el uso del lenguaje: leerlo o escucharlo, compren- 
derlo, utilizarlo para pensar e inferir, y producirlo en el habla y por escrito. El mo- 
delamiento de estas capacidades es en la actualidad el proyecto más formidable al 
que se enfrentan quienes trabajan en los campos de la simulación y la inteligencia 
artificial, La magnitud del problema ha llevado a fraccionarlo en varias disciplinas 
separadas, cada una de las cuales ataca un aspecto distinto. Existen buenas revi- 
siones generales de los problemas clave y las líneas de investigación, en Simmons 
(1970) y en los libros editados por Borko (1967), Minsky (1968), Schank (1975), y 
Simon y Siklossy (1972). A continuación verernos brevemente los cuatro campos 
por separado. 


Traducción mecánica 


Después de suministrar el texto a la computadora en un lenguaje (por ejemplo, 
ruso), la máquina tiene que producir una traducción aceptable en otro idioma (in- 
glés). Debido a los múltiples significados y usos de una determinada palabra en 
ambos idiomas, un programa simple de húsqueda de diccionario no produce más 
que galimatías. Se reguiere un análisis sintáctico y semántico (de significado), y 
esto es extremadamente difícil de suministrar. Alrededor de 1968, una confe- 
rencia de expertos acerca de las traducciones mecánicas llegó a la conclusión de 
que todos los esfuerzos basados en el análisis sintáctico y en la sustitución palabra 
por palabra había fracasado, y que este enfoque debía abandonarse. Es obvio que 
antes de que podamos traducir debemos comprender correctamente lo que se 
dice en el idioma original. Pero esto es de par sí un problema muy serio, de modo 
que los esfuerzos se han dirigido al diseño de programas que comprendan. La no- 
ción básica (por ejemplo, Schank, 1972) es la de poseer una base conceptual 
(comprensión significativa*) dentro de la que se traduzcan los enunciados y a 
partir de la cual se produzcan otros. Si la entrada y la salida se encuentran en len- 
guajes de superficie distinta, entonces tiene lugar la traducción. Uno de los me- 
jores programas de este tipo (para inglés-francés) es el de Wilks (1973). 


Recuperación de información 


Imaginemos que una persona solicita todos los documentos disponibles acerca 
de algún tema particular (por ejemplo, '“simulación del aprendizaje'*). La máquina 
idea), con su gran archivo de documentos y su lista de índices, determina el conte- 
nido de la petición y cuáles son los documentos que en verdad se requieren, los 
extrae de los archivos y los entrega (ya sea físicamente o en una lista de referen- 
cias). Además de comprender la solicitud, el problema aquí consiste en diseñar 
una clasificación adecuada y un sistema de índice, ya que los títulos de los artículos 
raras veces señalan la naturaleza de los temas que tratan. Otro enfoque es el de no 


496 Segunda paste. Teorías cognoscitivoorganizacionales 


almacenar índices de títulos de documentos, sino tomar al texto completo como 
base de datos. Por ejemplo, las versiones iniciales del programa PROTOSYN- 
THEX, de Simmons y sus colaboradores (1966), comenzaron con el texto de 
la enciclopedia del Golden Book de los niños en la memoria, y las preguntas se 
contestaban al recuperar las oraciones pertinentes. El programa debe loca- 
lizar en la memoria las oraciones que tienen la mayor parte de palabras en común 
con la solicitud, y ejecutar entonces algún anábsis sintáctico para verificar si los 
vocablos comunes se encuentran en la relación gramatical correcta. De ser así, el 
texto seleccionado se produciría como respuesta. El problema con este enfoque 
es triple: primero, la solicitud y la oración meta pertinente en almacenamiento 
pueden estar expresados en paráfrasis diferentes, de modo que la igualación de 
palabra literal no logre identificar la respuesta; segundo, los vocablos pueden ser 
ambiguos y, de nueva cuenta, la simple igualación de palabra no necesariamente 
seleccionará pasajes textuales relevantes para el significado mtencional del inte- 
resado (por ejemplo, una solicitud de información relativa a los ““bancos*” puede 
recuperar hechos acerca de los vuelos, construcción de pistas de carreras, o trans- 
acciones financieras); tercero, las preguntas generalmente piden inferencias o 
deducciones de una base de datos, en lugar de una simple emisión de información 
del almacén. Los programas que interpretan preguntas y establecen procedi- 
mientos de inferencia para computar respuestas se denominan sistemas de 
pregunta-respuesta. En muchos sentidos, son los programas más interesantes 
para los psicólogos. 


Inducción gramatical 


Ésta es un área de interés lógico que se refiere a la naturaleza aprendible de las 
reglas gramaticales de un lenguaje. El modelo determina esa corrección a partir de 
secuencias de palabras que juzga o no como gramaticales. La secuencia de pala- 
bras puede ir acompañada de alguna situación ambiental a la cual alude la ““ora- 
ción””. La tarea es supuestamente un modelo de aquel que enfrentan los niños que 
deben aprender las palabras y reglas gramaticales de su comunidad tingúística, al 
ser expuestos a miles de expresiones. La tarea de inducción es muy difícil, ya que 
los datos de las oraciones no suelen ser por sí solos lo bastante extensos O cru- 
ciales como para distinguir entre un gran conjunto de gramáticas equivalentes. 
Además, pocos métodos de inducción son lo suficientemente consistentes para lo- 
grar una gramática correcta tan sólo al generalizar a partir de una muestra de ex- 
presiones. Este trabajo acerca de la sintaxis pura no parece producir resultados 
prácticos, 

Un enfoque más prometedor es el de inducir una gramática partiendo de pares 
de entrada, que consisten en una oración superficial junto con un diagrama estruc- 
tura] de su significado en alguna base contextual (o perceptual). J. R. Anderson 
(1975, 1976), entre otros, ha demostrado formalmente que las reglas gramati- 
cales simples son aprendibles cuando el programa de inducción tiene acceso a ta- 
les pares de significado superficial. Adernás, en experimentos de laboratorio, 
Moeser y Bregman (1973) probaron que los lenguajes artificiales en miniatura, 
compuestos por unas cuantas reglas gramaticales y sílabas sin sentido como “*pa- 
labras””, son aprendibles por los adultos solamente si las expresiones del nuevo 
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lenguaje se parean con la situación perceptual a la que se refieren. Las palabras sin 
sentido deben referirse consistentemente a partes del campo perceptual, y la 
organización sintáctica de las partes de la oración debe reflejar propiedades de la or- 
ganización perceptual del campo visual. Sin embargo, trabajos posteriores su- 
gieren que el aprendizaje puede acelerarse con sólo marcar las partes constituti- 
vas de la secuencia de palabras mediante pausas o entonación. 

En interesantes trabajos relacionados, Hamburger y Wexler (1975), y Wexler y 
Culicover (en preparación) han establecido un algoritmo de inducción que apren- 
derá un pequeño conjunto de transformaciones de oraciones que preservan el sig- 
nificado. Por ejemplo, si el modelo recibe en un momento una oración activa 
(“Juan atrapó el pescado”), una oración pasiva correspondiente (“El pescado fue 
atrapado por Juan””) y una estructura de significado para ambas, el algoritmo de- 
duce la forma general de la transformación activa a pasiva. No es una tarea senci- 
lla, ya que la gran variedad de formas de oraciones encontradas requiere que el al- 
goritmo presente conceptos intermedios de componentes gramaticales, como 
"frase verbal”, “frase sustantiva que opera como objeto directo””, etcétera. El 
trabajo de Wexley y sus colegas está muy vinculado con los desarrollos en la 
lingúíística teórica, y ha descubierto importantes principios de la naturaleza apren- 
dible de diferentes distinciones y reglas gramaticales. 


Programas de comprensión y de pregunta-respuesta 


Las áreas de comprensión y de pregunta-respuesta se tratarán juntas, ya que 
una de las pruebas estándar de la comprensión de una oración es que seamos ca- 
paces de responder preguntas que requieran del uso de información en esa ora- 
ción. Sin embargo, la mayor parte de las investigaciones mantiene estos dos én- 
fasia un tanto separados, tal vez en detrimento del progreso en el área global. Los 
mejores programas de comprensión parecen ser precisamente aquellos que tienen 
un poderoso componente de inferencia y de pregunta-respuesta, junto con una 
base realista semántico-pragmática (Winograd, 1972; Schank, 19750). 

En la figura 12.22 aparece un diagrama de los componentes fundamentales de 
todos esos sistemas. El usuario (o el ambiente) inserta enunciados que son he- 
chos, preguntas o instrucciones. Estos enunciados suelen constituirse en un sub- 
conjunto restringido del idioma, donde no se permiten tipos particulares de com- 
plejidades gramaticales. Un traductor o analizador intenta convertir el enunciado 
de entrada en una versión codificada que los procesos internos del programa pue- 
den comprender y usar, Por supuesto, ésta es la principal dificultad, El análisis 
gramatical es el procedimiento mediante el cual los diferentes elementos de un 
enunciado se agrupan en una estructura lógica profunda, y Se asignan entonces a 
algún significado y papel en la expresión. Veamos un ejemplo: una oración ordinaria 
como “*el hombre que fue encolerizado por ello había convocado a los contami- 
nadores”” implica un conjunto complejo de relaciones sintácticas. El uso del ar- 
tículo definido el, señala que la persona que habla tiene a un hombre y a unos con- 
taminadores particulares en mente. Además, sabemos que el verbo principal es 
había convocado a pesar del hecho de que estas dos palabras están bien separadas 
en la oración. Además, sabemos que convocado ha de vincularse con hambre más 
que con el pronombre ello, que está más cerca del verbo. También sabemos que la 
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frase que comienza “quien...'* es una cláusula relativa que modifica a “el horm- 
bre”, y que ésta es una construcción pasiva que se extiende al verbo principal. La 
cláusula relativa misma es una proposición incrustada, que dice que ““algo enca- 
lerizó al hombre*”. Por otra parte, sabemos que el uso de *“ello”* en la cláusula 
relativa se refiere probablemente a algún efecto adverso del acto de contaminar (he- 
cho por los contaminadores), que ha encolerizado al hombre. Así, a un nivel com- 
ceptual la oración dice algo como **Algunas personas o instituciones contaminaron 
algo, lo cual fue la causa de que €) hombre se encolerizara, e hizo que llamara a 
esas personas o instituciones””; presumiblemente, los llamó por teléfono para 
quejarse por la contaminación que provocaban. Áunque cualquier persona tiene el 
conocimiento tácito para ejecutar sin esfuerzo esas tareas de análisis gramatical, 
para inferir y agregar todas Jas piezas necesarias de información y sus conexiones, 
resulta demasiado difícil programar una computadora para que efectúe esto con una 
variedad amplia y general de oraciones, Los analizadores de sintaxis más exitosos 
son los programados por Woods (1970), que realizó algo parecido a una gramá- 
tica de transformación chomskiana en una red de transición recursiva aumentada; 
por Marcus (1977), que es similar, y por Riesbeck (1975, 1978), que se funda- 
menta en reglas de producción que emplean palabras de contenido para construir 
representaciones significativas de oraciones. 

Un problema básico para los analizadores de sintaxis es que no basta con buscar 
tan sólo los diversos significados y partes gramaticales del habla de las palabras en 
una oración, y entonces seleccionar combinaciones de acuerdo con su ajuste a un 
sinnúmero de marcos gramaticales estándar. Ese enfoque rápidamente **explota'” 
en analizadores múltiples de la mayor parte de las oraciones. Veamos un ejemplo 
(citado por Quillian, 1968): una analizador gramatical inicial escrito por Kuno y de- 
nominado analizador sintáctico de paso múltiple-Harvard, dio 120 análisis gramati- 
cales diferentes de la oración de definición: *“Un látigo puede ser una vara con una 
cuerda 0 un trozo de cuero fijado en el extremo de la misma, usado para dar golpes 
a los animales de tiro, etc., o para castigar”. ¿Cómo puede ser que un tonto ana- 
lizador sintáctico vea 120 diferentes análisis gramaticales en esa oración, mientras 
que nosotros sólo vemos uno? Porque las palabras tienen múltiples sigruficados y 
clases de formas sintácticas, según el uso que se haga de las mismas en la oración. 
Por ejemplo, la palabra ''fijado”” (ftxed) en la definición puede ser un verbo o un 
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Figura 12.22. Principales componentes de un sistema de recuperación de hecho y 
contestación de pregunta. 
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adjetivo, y puede significar reparado, alterado, adulterado, sobarnado, arreglado o 
tinculado; y '“vara'” (stick) puede ser un verbo, un sustantivo o un adjetivo, y tie- 
ne más significados. Los significados de las palabras se multiplican en las combi- 
naciones de oraciones, y conducen a la absurda proliferación de interpretaciones 
múltiples de la oración. 

Evidentemente, lo que se necesita es alguna forma de combinar los significados 
de varias palabras de una manera que tenga sentido. Y eso es lo que intentan ha- 
cer varios sistemas de análisis gramatical basados en la semántica. En los ana- 
lizadores basados en la semántica, como los de Quillian (1968), Schank (1972) o 
Winograd (1972), la idea general es permitir que el contexto del discurso, así 
como los significados de las diversas palabras, actúen conjuntamente al lado de un 
analizador de sintaxis para determinar el análisis gramatical más probable y la in- 
terpretación de la oración. El sistema de análisis gramatical de Winograd es muy 
parecido al de Woods en el sentido de que existe una continua interacción entre la 
evaluación gramatical y la evaluación semántica (verificación del carácter signifi- 
cativo de un análisis gramatical provisional). El sistema de Winograd también difiere en 
el sentido de que gran parte del conocimiento que tiene en la memoria de largo plazo 
no está almacenado como hechos simples, sino como procedimientos o reglas para 
probar o inferir ciertas secuencias. Por ejemplo, en vez de almacenar directamen- 
te un hecho universal como “Todos los seres humanos son mortales'”, el sistema 
de Winograd lo almacenaría como un “teorema” etiquetado cuya interpretación 
es, a grandes rasgos: “'Si yo quisiera demostrar que Y es mortal, puede hacerlo al 
probar que Y es un ser humano””, El valor de esta representación reside en que 
facilita enormemente las inferencias, como el silogismo lógico propio de los estu- 
diantes de segundo año: “'Si Sócrates es humano, entonces Sócrates es mortal”, 

En aígunos de los sistemas más poderosos de contestación de pregunta (por 
ejemplo, el sistema QA-3 de C.C. Green y Raphael, 1968, y C.C. Green, 1969a, 
19695), la traducción va del inglés a las expresiones simbólicas en el cálculo pre- 
dicado. Los hechos que el sistema conoce se tratan entonces como un conjunto de 
axiomas, donde una pregunta a contestar se considera como un teorema que se 
probará al aplicar las reglas de la inferencia a los axiomas (el hecho base). Por 
ejemplo, si conoce hechos como JN (Bill, automóvil), e IN (automóvil, garage), y 
HAS (Bill, joyas), entonces el QA-3, mediante ciertas inferencias permitidas por 
los predicados 7N y HAS, puede probar que las joyas están ahora en el garage. La 
pregunta “¿Dónde están las joyas?** crearía un programa para encontrar una Y tal 
que ÍN (joyas, X) sea verdad. El sistema QA-3 de Green emplea el principio de 
resolución de J. A, Robinson (1970) para derivar mecánicamente el teorema (con- 
testación a la pregunta) a partir del sistema de axiomas (el conjunto de hechos co- 
nocidos), Aunque las técnicas de resolución sean poderosas herramientas de den- 
vación en la lógica, son ineficientes y no tienen parecido alguno con la manera en 
que la gente razona a partir de una base real, 

Como hemos señalado, uno de los programas de lenguaje más impresionantes 
es el que ideó Winograd (1972). Su sistema maneja un discurso acerca de un 
“mundo de juguete”” compuesto por una tabla de mesa sobre la cual hay cubos y 
pirámides de madera de diversos tamaños y colores, y una caja grande en la que 
pueden colocarse objetos. El programa de discurso acciona una ''mano mecánica'* 
que puede tomar cubos y moverlos. El programa tiene un número de predicados 
primitivos para describir su mundo visual, y las acciones que puede ejecutar en 
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relación con ese mundo de cubos. Su enfoque para resolver problemas de manipu- 
lación de cubos usa el lenguaje PLANNER, que permite una fácil formulación de 
submetas repetitivas, de modo muy parecido a como lo hace el programa STRIPS 
examinado anteriormente. Así, al dar la instrucción de Asir (cubo B1), el programa 
de Winograd verifica ciertas condiciones previas: *'¿ya está la mano asiendo a B1? 
¿Puede tomarse B1? ¿Está la mano cogiendo otra cosa? De ser así, deshacerse de 
ese objeto al encontrar un espacio libre en la mesa y colocarlo allí, ¿Está libre 
la parte superior de B1, de modo que la mano pueda asirlo? De no ser así, librar la 
parte superior de Bi. ¿Cómo? Al encontrar algún espacio libre sobre la mesa, 
y...” Este tipo de programa recursivo de rutinas de acción para resolver manipu- 
laciones con cubos se lleva a cabo con extraordinaria eficiencia. 

El programa de Winograd es ejemplar al combinar varias fuentes de información 
para presentar un análisis gramatical correcto y la comprensión de una oración. 
Las tres fuentes son: 1. reglas y expectativas sintácticas; 2. reglas de significado 
semántico para decidir qué combinaciones son razonables, y 3. el componente de 
inferencia-deducción, que busca las referencias de expresiones oscuras. El trabajo 
de estos tres componentes es coordinado, y pasan sus resultados o análisis par- 
ciales de atrás hacia adelante mientras obtienen la interpretación de una oración, 
Por ejemplo, después de que el programa acaba de escoger un pequeño cubo de 
madera de una mesa llena de cubos, pirámides y cajas, la siguiente oración que ve 
es ésta: “Encontrar un cubo que sea más alto que el que usted sostiene, y co- 
locarlo dentro de la caja”. El sistema debe deducir que ésta es tna orden para ha- 
cer algo, saber qué cubo sostiene, y saber que “lo”*, como pronombre enclítico 
adosado a ““colocar”” se refiere al cubo (si hay alguno), que el componente de de- 
ducción decide que es más alto que el que se sostiene en ese momento. El compo- 
nente de sintaxis nos dice que '“ese es más alto...”* es una cláusula relativa res- 
trictiva que modifica a la frase del sustantivo principal, y las partes de semántica y 
de deducción infieren que requiere de operaciones de comparación, “*... es más 
alto que...””, y ejecuta el conjunto de comparaciones necesarias para encontrar un 
cubo más alto en la mesa, El programa de Winograd era particularmente eficiente 
para deducir la referencia en contexto de pronombres como uno o ello, que 
pueden aludir a objetos, atributos, acciones o episodios. El programa realiza in- 
terpretaciones razonables en parte debido a que tiene conocimientos acerca de la 
situación del mundo de cubos a que se enfrenta; como resultado, muchas expre- 
siones que por lo común serían ambiguas pierden tal carácter en este restringido 
contexto. El programa de Winograd demostró lo que podría hacerse si un progra- 
ma opera en un mundo en miniatura donde todas las cosas poseen un nombre y lu- 
gar definidos y siguen reglas simples de la física. 

Al llevar a cabo una serie de acciones y submetas a lo largo del camino a fin de 
ejecutar una orden, el programa de Winograd almacena un registro explícito de la 
secuencia de eventos de nivel mtermedio. Este registro es muy útil para eliminar 
la ambigúedad de las referencias anafóricas o pronominales, en donde las oracio- 
nes posteriores hacen referencia a los eventos anteriores de un modo opaco. Por 
ejemplo, después de que al programa se le dice que escoja y mueva un cubo, luego 
que cuente el número de objetos que hay sobre la mesa y no en la caja, se le pre- 
gunta: *“¿Es, al menos alguno de ellos, más estrecho que el que te ordené que es- 
cogieras?” El problema aquí —que el programa de Winograd resuelve— consiste 
en comprender que el pronombre “ellos” se refiere a los objetos enumerados 
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previamente. También tiene un registro de qué cubo se le dijo que escugiera an- 
tes. Al recuperar las mediciones del cubo, el programa las compara con las de 
aquellos que no están en la caja, encuentra uno más estrecho, y entonces produce 
la respuesta; ''sí, el rojo”*. Esta memoria de corto plazo del eventu permite al 
programa resolver ambigiiedades de referencias y contestar preguntas acerca de 
por qué o cómo se produjo algún estado de cosas. En suma, el programa puede re- 
citar su autobiografía; tiene una rica variedad de capacidades de realización de in- 
ferencias y esto le permite, por ejemplo, responder a complicadas preguntas acer- 
ca de una escena visual, 


Análisis de dependencia conceptual 


Roger Schank (1972, 19754) y sus colaboradores (Schank y Abelson, 1977) 
idearon un enfoque muy interesante de la comprensión del lenguaje. Schank cree 
que el análisis del significado conceptual debería ser de interés primordial en la ela- 
boración de programas para el análisis gramatical y para comprender y responder 
preguntas. Ha intentado desarrollar un sistema de conceptos básicos que susten- 
tan a los verbos de acción, un conjunto de reglas para indicar cómo diferentes ca- 
tegorías de conceptos (como ACTOR, ACTO, OBJETO, ATRIBUTO) pueden depender 
unos de otros, y los métodos para trazar mapas de oraciones dentro y fuera de es- 
tas estructuras de significado. 

Los términos básicos en el nivel conceptual son: concepfualización (es decir, un 
pensamiento completo), objetos físicos (llamados productores de ilustraciones, 
PD, tiempos, ubicaciones y actos. Schank también postula un número de reglas 
conceptuales como estas: PI ejecuta actos, PI tiene atributos, los actos tienen ob- 
jetos, los actos pueden tener instrumentos y dirección, los actos pueden causar otras 
conceptualizaciones, Veamos un ejemplo: “John fue a la ciudad en su bicicleta”, 
donde “'John"* es el actor, ““fue”* es el nombre de una acción sustentadora primi- 
tiva denominada transferencia física, *'a la ciudad” es la dirección de la transferen- 
dia, y ““bicicleta”' es el instrumento usado en esa acción. 

Las conceptualizaciones también pueden relacionarse unas con otras, Una re- 
lación importante es la causalidad, donde una cosa es la causa de otra. En muchos 
idiomas, la relación causal entre dos conceptualizaciones en ocasiones se com- 
prime en una sola palabra llamada un **verbo causativo””. Así, “John mató un mos- 
quito”” puede entenderse conceptualmente como **Johx hizo algo que CAUSÓ que el 
mosquito cambiara su estado de vivo a muerto””. Mediante tales análisis de sig- 
nificado, Schank espera explicar la cercanía de significados de términos como 
matar, morir; comprar, vender; enseñar, aprender; causar, resultar; convencer, 
persuadir, etcétera, Además, cree que su ““nueva redacción conceptual'* de ora- 
ciones hace más fácil hallar implicaciones de determinadas declaraciones. Así, si 
aprendemos que John mató un mosquito, podemos preguntar (o estar preparados 
para aprender) cuándo y dónde ocurrió este evento, qué medios v instrumentos 
usó para matar al insecto, cuál fue la causa que motivó que John actuara de esa ma- 
nera, y qué posibles consecuencias siguieron. 

Schank ha promovido la idea de que la comprensión de una oración implica que 
fácilmente podemos obtener inferencias de ella. La hipótesis es que cuando una per- 
sona aprende un hecho dado, al mismo tiempo adquiere automáticamente Una 
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infinidad de implicaciones de ese hecho. Esto es importante no sólo para respon- 
der preguntas acerca de la información que contenga la oración, sino también para 
determinar la forma de nterpretar oraciones posteriores en un texto. Un programa 
inicial de Reiger (1975), colaborador de Schank, obtuvo hasta 18 variedades de in- 
ferencía de un solo aserto. Este programa generaría ondas sucesivas de inferen- 
cias hacia atrás y hacia adelante en el tiempo, a partir del evento descrito en la ora- 
ción. Por ejemplo, si el programa de Reiger escucha: “John le pegó a Bill porque 
Bill le dio calabazas a Mary”, haría inferencias como éstas: John tiene una mano, 
el puño de Jokin entró en contacto con el cuerpo de Bill, Bill rompió una relación 
romántica con Mary, esto hizo que Mary se sintiera triste, a John le agrada Mary, 
la tristeza de Mary molesta a John, John quiere castigar a Bill porque las acciones 
de Bill hicieron que Mary se sintiera triste, la tristeza de Mary antecedió a que 
John le pegara a Bill, Bill posiblemente esté lastimado, es probable que Mary se 
sienta mejor al ver que John castigó a Bill, Mary tal vez ahora le esté agradecida a 
Bill, etcétera. A medida que se obtiene cada inferencia, el programa de Reiger po- 
dría preguntar: ¿qué causó eso?; ¿qué deberá pasar a continuación?; ¿qué condi- 
ciones físicas y psicológicas eran necesarias para que ocurriese eso? El programa 
de Reiger simplemente redondea muchas de las cosas que **conoceríamos”” o 
conjeturaríamos después de haber escuchado ese enunciado. Desafortunadamente, 
esto conlleva un gran número de implicaciones. La mayor parte de ellas no están 
garantizadas por el significado de diccionario de las palabras en el aserto, sino que 
son sugeridas por nuestro conocimiento extralingúistico acerca de los asuntos hu- 
manos y la situación física. La relevancia del programa de Reiger para el teórico 
del aprendizaje reside en que explica en detalle una concepción de “lo que se 
aprende”' una vez que una persona acepta un hecho simple. 


Encadenamiento causal en eltexto 

Schank (1975b) argumentaba que el aserto no activa todas estas implicaciones, 
sino que sólo se obtienen aquellas inferencias necesarias para vincular esta oración 
con eventos posteriores en el discurso. Así, si después del evento del golpe la 
oración siguiente es; **Mary dio las gracias a John”*, Schank supone que el oyente 
construye un puente inferencial para vincular el incidente anterior del golpe con el 
incidente de dar las gracias. Esto pasaría por las inferencias de ““venganza”” acer- 
ca de lo complacida que estaba Mary al ver a Bill castigado. Schank sostiene que el 
lector es consciente sólo de aquellas inferencias particulares que unen declara- 
ciones en cadenas causales de eventos con mucha exactitud que recordará haber 
hecho mientras leía el texto. Thorndyke (1976) ha informado de evidencia psicológica 
que apoya esta conjetura. 

Schank (1975d) generalizó la noción del encadenamiento causal de eventos para 
predecir lo que sería críticamente importante y memorable en una historia corta. 
Al conectar un evento con otro, al observar la forma en que el primero permite o 
causa al segundo, el lector podría extraer la secuencia esquemática de acción en la 
historia, Considérese la narración simple y su cadena causal abreviada que apare- 
cen en la figura 12.23. Los eventos se vinculan por relaciones de facilitación o cau- 
sales, y en ese orden ocurren en la historia. Según Schank, esa es la espina dorsal 
de la historia, y estos hechos son los que se recordarán más nítidamente. La hipó- 
tesis de Schank establece que si elaboramos detalles alrededor de cualquier nodo 
simple (por ejemplo, la dificultad de John para ir a buscar la segadora mecánica o 
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Figura 12.23. Narración de un suceso simple y su análisis en cadenas causales depen- 
dientes, de acuerdo con el sistema de Schank. 
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los eventos rutinarios mientras siega el pasto), tales detalles no entran en la ca- 
dena principal de eventos, y por eso el lector los olvida rápidamente. En el trabajo 
experimental, J. Black y Bower (1930) descubrieron que dichas cadenas causales 
de eventos son predictores muy exactos acerca de qué declaraciones, dentro de 
narraciones breves, serían recordadas por grupos de lectores universitarios, 

Basta con una pequeña consideración para observar que un gran porcentaje de 
las inferencias necesarias para vincular declaraciones de textos las proporcionan la 
información extralingilística, el conocimiento del lector acerca de las situaciones 
sociales y físicas, y los eventos que se describen. Asi, podemos vincular el hecho 
de sacar la segadora mecánica porque sabemos que eso permite la acción de cor- 
tar el césped, que es la meta de John. Si entendemos la frase “sacar la segadora 
mecánica” no debido puramente a reglas lingúísticas, sino porque estamos famúba- 
rizados con la situación, podemos dividir el texto en sus componentes; es decir, 
las condiciones que permiten la acción hacia la meta. 


Comprensión de las metas y de los planes 


En un trabajo posterior, Schank y Abelson (1977) se concentraron en el análisis 
de narraciones que describen episodios humanos en términos de las metas del ca- 
rácter, los planes probables a los que conduce y las acciones que el plan motiva. 
Un texto que describe partes de la secuencia de meta-plan-acción puede com- 
prenderse al inferir otras partes, que ayudan a vincular las piezas dispares del tex- 
to. A menudo estas conexiones se oscurecerían si no comprendiéramos la meta y 
el plan que las sustenta. Consideremos varios ejemplos: 


1. Willa estaba en París y tenía hambre. 
Tomó la guía Michelin. 

2. Mary vio una tormenta que se aproximaba. 
Cerró las ventanas de su casa. 

3. El drogadicto Jack estaba desesperado por una inyección. 
Consiguió una pistola y fue a una tienda de Licores. 


Piense el lector durante un momento en la forma en que comprende esas viñe- 
tas, En la primera, sabe que Willa no se va a comer la guía Michelin, sino que ésta 
es un instrumento para encontrar un restaurante. En la segunda, sabe que las tor- 
mentas no cietran automáticamente las ventanas, sino que una meta normativa de 
Mary (es decir, tener las habitaciones secas) se ve amenazada por la tormenta, y 
cerrar las ventanas evita que las habitaciones se mojen. En la tercera, el lector 
sabe que Jack no obtendrá una inyección con su pistola o en una tienda de licores, 
sino que lo más probable es que use el arma para asaltar la tienda y conseguir dinero 
para comprar drogas. En parte, sabemos cso debido a nuestro conocimiento de las 
tiendas de licores, de por qué las personas desesperadas consiguen pistolas, y del 
argumento del “asalto a la tienda de licores”*, que es casi un cliché en el crimen 
estadounidense moderno. Schank y Abelson (1977) y su discípulo Willensky 
(1978) desarrollaron un programa que “comprende” un cierto número de esas vi- 
ñetas simples. Lo logran al inferir una meta para el personaje y al suponer que 
cada acción se ciñe a un plan para alcanzar esa meta. La diversidad de situaciones 
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y de complicados enredos motivacionales que el programa de Wilensky puede 
comprender es en verdad impresionante. El programa lo consigue al usar un am- 
plio conjunto de inferencias acerca de las motivaciones humanas, la forma en que 
los motivos se complementan o entran en conflicto unos con otros, la manera en 
que se diseñan los planes para vencer obstáculos y lograr consecución de un obje- 
hivo, y el modo en que las acciones adquieren su significación gracias a su papel en 
el plan del personaje. 

Si una secuencia particular de meta-plan se utiliza repetidas veces en una situa- 
ción estándar, Schank y Abelson suponen que se convierte en rutina para esa per- 
sona dentro de una actividad convencional que denominan esgumento. Un argu- 
mento se refiere a una secuencia estereotipada de eventos o a una actividad como 
comer en un restaurante de moda, someterse a un examen médico, efectuar una 
llamada de larga distancia desde una cabina telefónica, asistir a una conferencia, 
etcétera. Mediante las experiencias directas y vicarias las personas de Jas culturas 
occidentales han aprendido planes de acción más o menos rutinarios para lograr 
gus metas en éstas y en cientos de situaciones más. Nuestro conocimiento acerca 
de tales actividades rutinarias interviene pata comprender textos que se refieren 
elípticamente a ellas, Considérese esta viñeta mínima. 


John fue a un restaurante italiano. 
Ordenó lasaña 
Le gustó y dejó una buena propina. 


Los lectores tienen bastante más conocimientos acerca de lo que sucedió de lo 
que se declara en los enunciados. Este exceso de conocimientos se hace evidente 
cuando usted responde a preguntas relacionadas con la historia: ¿entró John al 
restaurante? ¿Se sentó? ¿Leyó el menú? ¿Habló con un mesero o una mesera? ¿Co- 
mió? ¿Qué? ¿Pagó por ella? Contestamos esas preguntas con rapidez al recurrir a 
nuestros conocimientos de los eventos prototípicos en el argumento del restaurante. 
Schank y sus asociados (1975) han escrito un programa, el SAM, que utiliza argumen- 
tos para rellenar las conexinnes faltantes entre las líneas estipuladas en tales textos. 
Los experimentos de G. H. Bower, Black y Turner (1979) descubrieron que al re- 
cordar esas historias basadas en argumentos, las personas son particularmente 
propensas a recordar aquellos eventos del argumento que no están establecidos, 
sino los que éste implica con fuerza. Por ejemplo, en relación con nuestro texto 
anterior, el lector podría creer después de unos cuantos minutos que los enuncia- 
dos estipulan que John comía lasaña o que payaba la cuenta. Así, hay una clara evi- 
dencia psicológica de los procesos de relleno que el SAM postula. 

En un desarrollo relacionado, Lehnert (1978), colega de 5Schank, escribió un 
complicado programa de pregunta-respuesta, experto en dar respuestas pareci- 
das a las humanas a preguntas acerca de viñetas basadas en argumentos tales 
coro el anterior, de John que ordena lasaña. El citado programa primero clasifica 
alas preguntas en una de seis categorías, y entonces convoca diferentes algorit- 
mos de la búsqueda de mernoria y construcción de respuesta, según el tipo de pre- 
gunta. De este modo, las preguntas simples de POR QUÉ acerca de las acciones, a 
menudo se contestan al buscar la submeta estereotipada a la que esa acción sirve 
en el argumento; por ejemplo, “¿por qué John levó el menú? Porque quería 
ordenar la comida”. 
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Varios de los métodos de contestación de Lehnert son muy ingeniosos, Uno de 
ellos es la noción de una senda fantasma de lo que podría haber sucedido, ya 
que muchas veces hay preguntas posteriores que se refieren a esto. Supóngase que 
alteramos nuestra viñeta de modo que después de que John ordenara lasaña, se le 
dijera que se había terminado; entonces pide escalopes de ternera. La arden-lasa- 
ña-entonces-falla-entonces-reordena-ternera es lo que Lehnert denomina un par 
de “'interrupción-resolución'”. Cuando en la historia aparece uno de ellos, el pro- 
grama construye una secuencia hipotética (o senda fantasma) de eventos que nor- 
malmente habrían ocurrido si la interrupción no se hubiera presentado. En el pre- 
sente caso, esta senda fantasma contendría eventos como el que Jahn ordenara y 
comiera lasaña. Más tarde, preguntamos al programa de Lehnert: “¿Por qué John 
no comió lasaña?”' E) evento de la pregunta no se encuentra en la memoria de la 
computadora de la cadena real de eventos, pero “John come lasaña'* se equipara 
con la senda fantasma generada a partir del punto de interrupción. Cuando se en- 
cuentra esta igualación, el programa regresa a la interrupción que creó tal senda 
secundaria y da eso como respuesta. En este caso, la respuesta es: “Como en el 
restaurante se había terminado la lasaña, ordenó escalopes de teznera'”, Ésta es 
aproximadamente la respuesta que las personas dan a tales preguntas acerca de 
las expectativas fallidas. 

El programa de Lebnert en muchos aspectos se equipara a las características de 
la contestación humana de preguntas, y constituye un logro en la simulación del 
procesamiento del lenguaje natural. 

El lector no debe confundir las metas de proyectos como el SAM de Schank y el 
contestador de preguntas de Lehnert. Éstos se interesan en las capacidades ge- 
nerales de los seres humanos para redondear textos con inferencias fundamenta- 
les acerca de las situaciones, sus habilidades para interpretar preguntas, y en- 
contrar o deducir respuestas. Creen que la mejor estrategia de investigación para 
comprobar sus ideas generales es modelar la comprensión y la contestación de 
preguntas en un dominio muy restringido, como los restaurantes, los viajes en au- 
tobús, los accidentes automovilísticos, las visitas diplomáticas o los actos terroris- 
Las, entre otros. El argumento del restaurante es un tipo de mundo de juguete o mi- 
crocosmos para experimentar con ideas acerca de cómo construir sistemas de en- 
tendimiento parecidos al tumano. Esa estrategia de investigación es familiar en 
otras ciencias (como en los esfuerzos de genetistas con los genes de las moscas o 
las bacterias intestinales), donde unas cuantas preparaciones se investigan in- 
tensivamente con la premisa de que los resultados se generalizarán a una gran 
variedad de casos. Asi, al discutir la forma en que el SAM sabe que ““Joha comió la 
lasaña””, al mismo tiempo estamos discutiendo los mecanismos generales para re- 
solver una de las metas más significantes de la psicología cognoscitivista: la cons- 
trucción de un modelo del entendimiento humano. 


DISCUSIÓN Y EVALUACIÓN 


Una vez que hemos descrito varios modelos del procesamiento de la informa- 
ción que atañen a la teoría de la conducta, es útil puntualizar algunas de las ventajas 
y logros de este enfoque, así como ciertos problemas relacionados con el mismo. 
Primero abordaremos este último aspecto, ya que preferimos terminar la sección 
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con una vena positiva y abierta al futuro. Los principales problemas son los de la 
comunicación y evaluación del buen ajuste. 


El problema de la comunicación 


El vacío en la comunicación entre los simuladores por computadora y los psi- 
cólogos experimentales es muy serio, pero parece acortarse con el paso del tiem- 
po. Á pesar de las contribuciones de los desarrollos en la simulación por computa- 
dora, los psicólogos se han mostrado muy lentos en lo que toca a la adopción de las 
técnicas de simulación puestas a su disposición. Una razón de ese vacío en la co- 
municación estriba en la diferencia en historial, habilidades y lenguajes que existe 
entre los psicólogos experimentales y los científicos de la computación. Los pro- 
gramas de simulación se componen de secuencias de instrucciones excesivamente lar- 
gas, con una gran saturación de complicados detalles. Todos estos programas están 
envueltos y codificados en un lenguaje especial adaptado a la comunicación con una 
computadora, y no con un psicólogo que no entiende nada del L7SP. Como observa 
W. R. Reitman: 


«La descripción de una versión reciente del programa Solucionador General de Pro- 
blemas (SGP) de Newell, Shaw y Simon ocupa más de 100 páginas, y aún así cubre sólo 
los detalles esenciales del sistema. Es más, el simple examen del mismo presupone el co- 
nocimiento de un artículo anterior acerca del SGP, y nociones relacionadas con el len- 
guaje del procesamiento de información Y (LPI-Y), el lenguaje de computadora en que 
está escrito, Por último, el apéndice, que sombra tan sólo las rutinas y estructuras em- 
pleadas, consta de otras 25 páginas. A no ser que se esté familiarizado con sistemas pa- 
recidos, una minuciosa comprensión de las propiedades dinámicas de un modelo tán com- 
plejo presupone, sin lugar a dudas, gran experiencia con el programa en cuestión y con su 
sálida (1964, pág. 4). 


Adquirir destreza con uno o más de los lenguajes de procesamiento de lista in- 
sume mucho tiempo, de modo que resuita difícil para los científicos que tienen 
poca tiempo disponible a causa de sus actividades de investigación. En lugar de un 
aprendizaje prolongado con un programa de modelo y la computadora, el experi- 
mentador común depende de un intermediario que interprete el programa. Debido 
al incompleto conocimiento que un neófito tiene del programa, hay cierta incer- 
tidumbre en lo que se refiere a las suposiciones psicológicas de la teoría, o bien no 
puede captarse la importancia y naturaleza crítica de una u otra característica en la 
ejecución global, como el modo de codificar una subrutina particular, 

Pero al parecer estos problemas han comenzado a solucionarse en el transcurso 
de los años, por tres razones. Primero, las nuevas generaciones de estudiantes 
graduados en psicología se adiestran en la ciencia de la computación, de manera 
que pueden escribir programas de simulación y comprender los que otros elabo- 
ran. Segundo, los mismos teóricos de la simulación (por ejemplo, Gregg y Simon, 
1967) han señalado que la mayor parte de los programas son básicamente muy 
simples, y que su longitud es el resultado de instrucciones necesarias aunque pst- 
cológicamente irrelevantes para su manejo o gobierno. De acuerdo con este enfo- 
que, los artículos publicados en los que se anuncian nuevos programas de si- 
mulación a menudo contienen grandes secciones de diagramas de flujo y descripción 
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de estrategias, procesos y operación básica de los mismos, todo ello en términos 
comprensibles para cualquier psicólogo. En principio, cualquier programador 
experimentado podría traducir tales descripciones de programas en un progra- 
ma de cornda. Una tercera razón para la disminución del vacío en la comunica- 
ción es que los conceptos y metáforas del procesamiento de la información ya se 
han infiltrado en la psicología teórica y se han convertido en términos técnicos fa- 
miliares (J. R. Anderson y Bower, 1973; P. H. Lindsay y Norman, 1972), El len- 
guaje del procesamiento de información (de los programas, subrutinas, decisiones 
condicionales, subproblemas y submetas recursivas, búsqueda mediante locali- 
zaciones, memorias asociativas) ha sido adoptado, en gran parte, especialmente 
por los psicólogos cognoscitivistas, como una analogía de la forma en que opera la 
mente. Como las teorías psicológicas se formulan cada vez más el idioma del pro- 
cesamiento de información, la descripción de los programas de simulación es 
ahora un vocabulario familiar y comprensible para los psicólogos. Quizá más que 
cualquier otro indicador, esta adopción en masa de las metáforas del procesa- 
miento de información dentro de la psicología teórica refleja el impacto funda- 
mental del movimiento de la simulación por computadora. 


Evaluación del buen ajuste 


Otro problema importante asociado a las teorías de simulación por computadora 
(que pretenden ser modelos de la persona humana) reside en la evaluación de la 
bondad del ajuste del modelo o los datos, Primero, para los modelos complejos 
como el SGP o el EPAM, prácticamente no pueden probarse teoremas generales 
acerca de características específicas de la conducta de los mismos en situaciones 
particulares, En este aspecto, difieren de las teorías matemáticas (al menos de 
aquellas en las que se obtienen soluciones explícitas). Tales teoremas generales 
suelen ser ecuaciones explícitas de la forma: “si los estadísticos de los datos x,, 4», 
tienen valores conocidos, entonces los estadísticos de los datos 47, x, deberán te- 
ner los valores Xy = f(%, x) y Xy = L(%,, Xx). En gran parte de las teorías del 
procesamiento de la información, los resultados de una sola corrida de simulación 
tal vez no sean muy informativos acerca de las características generales de la con- 
ducta que el programa puede mostrar. Por lo tanto, deben hacerse muchas corri- 
das de simulación, usualmente baje circunstancias o parámetros del modelo que 
varjen ligeramente, con la esperanza de que puedan inferirse algunas propiedades 
generales de la conducta que éste exhibe al examinar la muestra de resultados. 
Newell y Simon observan el problema de la siguiente manera: 


...Podemos estudiar el modelo empíricamente, explorando su comportamiento con va- 
riaciones de los parámetros y cosas semejantes. Pero hasta la fecha no hay un conjunto de 
teoremas y de medios generales de inferencia que nos permitan deducir propiedades ge- 
nerales del programa dado de forma simbótica. Casi ningún teorema interesante, en el 
sentido matemáticamente aceptado de Ja palabra, ha sido probado jamás sobre programas 
particulares (1963, pág. 375). 


Mediante este método, la acumulación de conocimientos acerca de las capaci- 
dades específicas de un programa suele ser lenta. Como consecuencia de esta 
acumulación, el teórico a menudo no puede responder preguntas precisas en lo 
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que toca a su modelo, hasta que haya corrido su programa en esas condiciones es- 
pecíficas exactas. Así, Ja retroalimentación de información con frecuencia es muy 
retardada para el experimentador inquisitivo. 

En lugar de los teoremas generales, hay dos métodos predilectos para compro- 
bar la validez de un modelo de simulación de solución de problemas. Uno de eltos 
consiste en hacer que el programa “maneje” satisfactoriamente un cierto nú- 
mero de casos especiales, así como el programa de Winograd resuelve de forma 
correcta referencias particulares para ello o uno en contextos especificos de dis- 
curso. Otro método de comprobación apreciado es el de comparar directamente 
y paso por paso las declaraciones del sujeto núentras piensa en voz alta y los ““ra- 
zonamientos”” correspondientes producidos por el programa de la computadora. 
La comparación con una sola huella de computadora del programa no basta si éste 
implica muchos elesentos probabilísticos y, en consecuencia, muestra una con- 
ducta muy variable en diferentes carreras. Sin embargo, en los programas que 
emplean este método de '*ajuste de protocolo” (la máquina de elección binaria de 
Feldman y el SGP), intervienen muy pocos o ningún eleraento probabilístico; por 
lo tanto, siempre se obtiene la misma huella, dados los mismos estados de partida 
y las secuencias de los eventos experimentales. 

A pesar de sus diversos méritos, la técnica de pensar en voz alta también tiene 
desventajas. Á menudo deben corregirse las observaciones del sujeto, '“anali- 
zarse en contenido”” y codificarse en términos comparables a la huefla de la com- 
putadora. Asimismo, debe asumirse que el sujeto omite decirnos o informarnos 
acerca de un número de procesos por los que está atravesando, Pero, ¿cuáles 
son? Puede argumentarse de mado plausible que el formato y el contenido de las 
declaraciones de pensamiento del sujeto en voz alta son en parte determinadas 
por reforzamientos incidentales y selectivos que proporciona el experimentador. 
Por ejemplo, en un protocolo publicado (Feldman, 1961) parecería que durante los 
ensayos iniciales el sujeto aprende qué tipos de declaraciones de pensamiento en 
voz alta aceptaba el experimentador, El efecto del reforzamiento casual (mediante 
la expresión facial, el tono de la voz, etc.) sobre la conducta en tales situaciones 
ambiguas está bien establecido (Krasner, 1958). Si se le presiona, un teórico E-R 
argumentaría que el contenido de las declaraciones de pensamiento en voz alta po- 
drían considerarse como racionalizaciones de los efectos más primitivos de la se- 
lección automática de respuestas de acuerdo con los hábitos (¿producciones?) 
establecidos por la experiencia pasada. En este punto resuita relevante un inquie- 
tante experimento de Verplanck (1962), en el cual se demuestra que al reforzar 
sutilmente las respuestas motoras de un sujeto y el contenido de sus racio- 
nalizaciones verbales, estas dos respuestas podrían moldearse casi independien- 
temente una de la otra, incluso hasta el punto de ponerias fuera de íase. 

Skinner (1969) proporciona una perspectiva esciarecedora acerca de varios pto- 
cesos en la solución de problemas, incluyendo la habilidad (o incapacidad) de la 
persona para verbalizar todos Jos pasas en los que *'piensa””. Skinner también in- 
troduce una distinción muy útil entre la conducta “gobernada por reglas”* —-Ja cual 
es mediada por reglas explícitas (verbalizables)— y la conducta moldeada por una 
larga historia de contingencias de reforzamiento, que pueden ser “inconscientes, 
automáticas y no verbalizables”*. Un ejemplo es la discrepancia a menudo citada 
entre la manera en que los grandes maestros juegan al ajedrez y la forma en que 
dicen que Jo hacen; un programa basado sólo en sus recomendaciones sería muy 
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parecido al de un aficionado. Como resulta obvio en estudios posteriores (Chase y 
Sirnon, 1973), los maestros de ajedrez han almacenado un gran caudal de conoci- 
mientos no verbalizados de “situación-acción”* debido a que jugaron miles de par- 
tidas. Los antiguos programas de juegos contenían, en gran medidad procesos 
gobernados por reglas para la búsqueda y la evaluación, y muy poco del reconoci- 
miento significativo de patrón. Sin embargo nada impide agregar a los programas 
de juego una gran memoria de patrón de ajedrez (Simon y Barenfeld, 1969), de 
modo parecido a como lo hizo Samuels con su programa del jue go de damas. 
Ericson y Simon (1978) han presentado un úti) análisis de la validez de los pro- 
tocolos de pensamiento en voz alta (que incidentalmente era un procedimiento re- 
comendado por John Watson), las inferencias que garantizan y la forma en que se 
utilizan para comprobar teorías de la simulación de los procesos cognoscitivos. 
Estos investigadores distinguen los diversos tipos de informes introspectivos en 
uso según cuándo ocurra el informe acerca de las actividades mentales meta (ya 
sea durante la actividad mental, inmediatamente o mucho tiempo después de ella), 
y la especificidad de las instrucciones acerca de qué es exactamente lo que el su- 
jeto informa (por ejemplo, dar una “descripción momento a momento”* en contra- 
posición a un ““sumario general”? de sus actividades). Señalan que los informes in- 
trospectivos de lo que el sujeto atiende o de la regla que emplea son muy exactos 
cuando se hacen en el momento, mientras que la “*retrospección”* posterior que 
depende de la memoria crea dificultades. Ericson y Simon argumentan que al uti- 
lizar los protocolos de pensamiento en voz alta para comprobar una teoría de si- 
raulación (por ejemplo, probar teoremas en la lógica), el teórico se vale de los in- 
formes introspectivos como indicadores de qué paso problema (o declaración) es 
el foco de atención actual del sujeto, pero que los comentarios de éste no con- 
tienen explícitamente las causas de su pensamiento. Podemos concebir al pensa- 
miento como una secuencia de saltos a la manera de un niño que cruza un arroyo 
brincando sobre las piedras que hay en su cauce; por analogía, el pensador puede 
informar de su meta global y de sus submetas, y describir la **piedra"” sobre la que 
acaba de saltar, aunque quizá sea bastante inexacto o sencillamente inconsciente de 
los procesos que sustentan el por qué de ese paso en ese preciso momento, Los 
investigadores también sostienen que una teoría de la sinulación puede compro- 
barse auténticamente al notar sólo los estados problemáticos a los que la persona 
entra (por analogía, las piedras sobre las que cae), independientemente de su inca- 
pacidad para comentar con validez cualquier paso particular que dé. La teoría de la 
solución de problemas explica estos pasos, pero no necesitamos que el sujeto sea 
capaz de informar de los mecanismos causales de sus movimientos. 
Superficialmente, el problema de la validación de una teoría de la simulación pa- 
recería menos grave con los procesadores del lenguaje; un programa analiza gra- 
maticalmente una oración de corno correcta o no, encuentra o no una referencia 
apropiada para un pronombre, contesta o no una pregunta de modo adecuado. Si 
falla en cualquier prueba, requiere modificación. Pero el problema se dificulta al 
comprender que los programas deben tratar por necesidad con una pequeña pero 
representativa muestra de palabras y limitadas construcciones sintácticas de en- 
trada. Demostrar que el programa no logra tratar con oraciones que emplean pa- 
labras que no se le han enseñado no es una objeción válida, ya que esa objeción se 
subsana al aurnentar el vocabulario del programa. Por lo común, los programas de 
lenguaje se elaboran para relacionarse con oraciones de ciertos tipos sintácticos, y 


Cap. 12. Teorías del procesamiento de información 5um 


los ejemplares de estos tipos pueden usarse repetidas veces en el desarrollo del 
programa. El hecho de que el programa final trate exactamente con aquellos ejem- 
plos tiene poco interés: al lector se le debe presentar alguna clase de pruebas o 
casos de generalización que le permitan evaluar el poder y la extinción de las va- 
nantes sintácticas o semánticas con las cuales el programa de comprensión de len- 
guaje puede relacionarse. 

Al aceptar los diversos métodos de comprobación de los modelos de simulación, 
una característica común es que el modelo normalmente se compara con los proto- 
colos de sólo uno o dos sujetos seleccionados de manera adecuada (por lo común 
personas brillantes y de buena articulación). De hecho, el programa puede escri- 
birse para simular el protocolo de solución de problemas de un sujeto particular; el 
modelo usualmente difiere en pequeños detalles cuando se ajusta a distintos indivi- 
duos. El argumento es que los individuos en realidad difieren, a veces considerable- 
mente, e ignorar este hecho sólo conduce a conclusiones sin validez. Al construir 
un modelo, insertamos vatios procesos o premisas generales, pero lo deja- 
mos abierto en lo que respecta a un margen de procesos específicas posibles o sus 
parámetros, que pueden alterarse para modelar a un sujeto particular, Es de es- 
perar que sólo sea necesario cambiar estos procesos marginales para hacer que el 
modelo se ajuste a otros sujetos. De modo análogo a un análisis factorial, el valor 
de la empresa de modelado depende de los valores relativos de los factores comu- 
nes (procesos generales), en relación con los factores específicos o únicos que se 
alteran para reducir los ajustes con diferentes sujetos. En la actualidad, los 
teóricos tienen que admitir que estos valores relativos son desconocidos. 


Ventajas en la simulación 


Concluyamos esta sección mencionando algunos logros, beneficios y ventajas 
del enfoque de la simulación. Ante todo el enfoque de la simulación ha sido un 
fuerte antídoto contra la tendencia esencialmente analítica que por lo general ha 
caracterizado a la psicología experimental. La labor de un científico se queda a me- 
dias cuando ha realizado una descomposición cuidadosa, analítica, de un fenómeno 
conductual, Una fase de igual importancia —y que a memido se descuida— consis- 
te en demostrar cómo reconstruir o sintetizar la conducta a partir de esas unida- 
des analíticas. Si la conducta es compleja, se tiene toda la razón para exigir una 
síntesis (un modelo) que englobe adecuadamente los fenómenos que intenta ex- 
plicar. La computadora es una herramienta que nos ayuda a probar que nuestra 
teoría especifica las partes suficientes, junto con los detalles necesarios acerca de 
las reglas exactas de operación que determinan su comportamiento, En el modelo 
no puede haber suposiciones ocultas o implícitas; si no está escrito explícitamente 
en el programa, la computadora imprime “basura”*, y lo rechaza de forma vio- 
lenta, lo que constituye una soberana lección acerca de la necesidad de ser ex- 
plícito y completo. Los teóricos encuentran que la programación de su teoría acer- 
ca de un fenómeno es un ejercicio revelador; a menudo permite ver yarios as- 
pectos del programa que no se habían considerado o que no funcionan, 

Un segundo punto que hemos aprendido es que los procesos mentales superio- 
res no son tan misteriosos ni tan complicados como para impedir un modelamiento 
exacto, como antes se creía. Newell y Simon lo establecen con claridad: 
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Lo primero que hemos aprendido (y la evidencia es muy sustancial) es que podemos ex- 
plicar muchos de los procesos del pensamiento sin postular mecanismos a niveles sub- 
conscientes, y que se diferencien de aquellos que son en parte conscientes y en parte ver- 
balizados. Comienza a verse que los procesos de soltición de problemas son los procesos 
familiares de observación, búsqueda, modificación en la dirección de la búsqueda de 
acuerdo con ciertas claves, etcétera. Los mismos procesos manipuladores de simbolos 
que intervienen en estas funciones son también suficientes para tales técnicas de solución 
de problemas, como la abstracción y el uso de imágenes, Cada vez es más evidente que la 
solución de problemas se logra mediante la solución de estructuras complejas de ele- 
mentos familiares simples. La prueba es que podemos simular la solución de problemas en 
innumerables situaciones sin otro recurso que estos elementos simples, como los bloques 
de construcción de nuestros programas (1963, pág. 402). 


La posición general de que la solución de problemas implica secuencias orga- 
nizadas sólo de procesos elementales no es por sí mismo una proposición compro- 
bable, sino más bien una orientación o estrategia que sirve para iniciar la empresa 
de construir una teoría. En cierto sentido, es verdad que cualquier proceso corm 
plejo a la postre se comprende en términos de secuencias de operaciones elementa- 
les (familiares). Así. esta posición refleja la confianza en que los procesos mentales 
superiores finalmente llegarán a comprenderse mediante los métodos relacionados 
de la ciencia, 

Un tercer beneficio, como hemos dicho, es que la computadora y el procesa: 
miento de información proporciona metáforas y analogías muy atractivas para las 
interpretaciones psicológicas (Newell, 1970). Se dice que las máquinas programa- 
das detectan, identifican, comparan y clasifican los estímulos; almacenan y recupe- 
ran información; aprenden y responden preguntas; piensan, solucionan problemas 
y deciden qué estrategias usar, etcétera. Al ver mecánicamente cómo se llevan 
a cabo estos procesos en un programa de computadora, nos sentimos tentados a 
creer que estos términos han perdido su matiz mental y que ahora compren- 
demos la forma en que los organismos reales hacen cosas a las cuales les damos el 
mismo nombre, Indudablemente, la primera creencia es válida; explica que los 
conceptos del procesamiento de información constituyen el idioma aceptado 
dentro de la psicología cognoscitivista moderna y han reemplazado por completo ala 
terminología de estímulo-respuesta que anteriormente dominaba en las discusiones 
de la psicología experimental. Esta influencia se describirá en el siguiente capítulo, 
en ocasión de examinar la psicología cognoscitivista contemporánea. El que esas 
analogías del procesamiento de información produzcan o no un entendimiento real 
es una cuestión que todavía se discute. (Parte de esta controversia surge de di- 
ferentes perspectivas acerca de lo que significa “comprender científicamente” 
algún fenómeno.) Por ejemplo, un teórico como Skinner afirma que la ““histaria 
interior”* de una simnlación por computadora 


no nos dice nada nuevo acerca de la conducta. Sólo cuando sabemos lo que un hombre 
hace en verdad podemos estar seguros de que hemos simulado esa conducta. Primero 
debe contarse la historia exterior (1969, pág. 295). 


Skinner tiene algunos puntos de vista extremos acerca de la naturaleza del enten- 
dimiento científico. La opinión alternativa, según la cual las correlaciones situa- 
ción-acción sólo pueden comprenderse mediante teorías racionales acerca del hi- 
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potético procesamiento de información interno del organismo, constituye el tema 
dominante en la psicología cognoscitivista. Este cambio en el paradigma de la psi- 
cología teórica se observó (y alentó) en una reseña general de Newell (1970) acer- 
ca de las relaciones entre la investigación en la psicología experimental y la inte- 
ligencia artificial. Afirma que la simulación por computadora es sólo un medio de 
hacer psicología teórica. Después de revisar algunos usos de los modelos simbóli- 
cos en la psicología experimental, sugiere que “en el Zeitgeist en psicología ha te- 
nido lugar un cambio hacia una visión del ser humano como procesador de informa- 
ción”” (pág. 376). Más adelante dice: 


Si miramos en dónde se ha concentrado el interés durante los últimos diez años en 
la psicología (los lugares en los que se ha producido un crecimiento rápido y de los que la 
gente habla cuando se le pregunta *'¿qué novedades hay?”*), una parte sustancial de ellos 
están conectados con este cambio hacia los modelos del procesamiento de información 
(pág. 378). 


Un cuarto beneficio de suma importancia es que la labor acerca de la simulación 
ha hecho accesible el estudio y la explicación de los procesos cognoscitivos com- 
plejos. Ha reorientado la tendencia desequilibrada del conductismo hacia análisis 
más finos, y al estudio profundo de unidades más pequeñas de conducta en condi- 
ciones artificiales. Se ha argurnentado que las conductas cormplejas (pensamiento, 
lenguaje y solución de problemas) podrían entenderse con mayor facilidad una vez 
que se comprendieran mejor las conductas simples en condiciones especialmente 
simplificadas (por ejemplo, aprendizaje de rutina, ratas que aprenden laberintos, 
etc.), Después de 40 o 50 años sin notables avances en nuestra comprensión de 
las capacidades de la mente humana, este argumento comenzó a cobrar fuerza y, 
sin duda, es motivo de desilusión y desaliento para muchos estudiantes que inician 
un curso de psicología. Pero la tecnología de simulación por computadora nos pro- 
porciona un instrumento para tratar con la complejidad de nuestras teorías, y nos 
da un nuevo ímpetu en el estudio de las capacidades humanas en el campo del pen- 
samiento. En la conclusión de una revisión de artículos acerca de las teorías de la 
simulación, Shepard observa con gran claridad: 


...El inicio que se ejemplifica tan admirablernente en muchos de los artículos reunidos 
por Feigenbaumn y Feldman, establece una nueva dirección en la cual todos los que aspiran 
a formulaciones precisas y rigurosas todavía pueden encontrar su camino para llegar al co- 
razón de la psicología; es decir, al estudio de aquellos procesos que singularizan al ser 
humano de entre los demás sistemas físicos conocidos. Debido a las grandes com- 
plejidades inherentes al problema, el progreso ha de ser lento, tal vez dolorosamente 
lento. Pero a no ser que se abandone la meta, ¿qué otra posibilidad nos quedo? (1964, pág. 
65). 
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Desarrollos recientes 
en las 


teorías cognoscitivistas 


La psicología contemporánea es testigo de una creciente convergencia de las 
teorías del aprendizaje históricamente distintas. En gran parte, se debe a que el 
movimiento conductista ha perdido mucho de su fervor revolucionario y en la ac- 
tualidad tiene menos defensores de renombre. Los conductistas parecen más dis- 
puestos a aceptar los fenómenos de interés para los psicólogos cognoscitivistas y 
a hacer más liberales a sus teorías para tratar con la imaginación sensorial, el con- 
dicionamiento sensorio-sensorial, el aprendizaje de hipótesis, el aprendizaje por 
observación, la toma de decisiones y las tendencias en el procesamiento de 
información en el aprendizaje. 

Los límites entre las posiciones históricas se han relajado, desvanecido, y ya no 
se distinguen con claridad. También los debates se han calmado. Los experimen- 
talistas hablan cada vez más el mismo lenguaje y se escuchan unos a otros; ade- 
más, se advierte una creciente unidad de lenguaje y comprensión entre ellos. No 
es extraño que un experimentalista opere dentro de muchas de las que antes se 
consideraban orientaciones teóricas distintas, que van desde la teoría hultiana has- 
ta la simulación por computadora. 

Cada subárea empírica tiene fenómenos especiales que atraen el interés, y 
puede aprenderse rápidamente el vocabulario de conceptos equivalentes necesa- 
ño para moverse entre la subáreas. 

En este capítulo examinaremos algunas de las líneas prominentes de la investi- 
gación reciente y la teorización que integran una perspectiva cognoscitiva del 
aprendizaje. Los temas son una muestra seleccionada, y para cubrirlos con más 
profundidad pueden consultarse diversos libros acerca de psicología cognoscitivis- 
ta (Glass el el., 1979; Neisser, 1967, 1976; Wickelgren, 19790). En primer lugar 
se considerará la crítica de la psicología cognoscitivista a la teoría £-K del con- 
dicionamiento y su explicación de la memoria humana. Después abordaremos un 
cierto número de temas y teorías de la psicología cognoscitivista contemporánea. 
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CRÍTICA DE LA TEORÍA E-R DEL 
CONDICIONAMIENTO 


En el capítulo 9 se revisaron las obras acerca del precondicionamierto sensorial y 
los mapas cognoscitivos (Menzel, 1973; Olton, 1979). De acuerdo con esos resul- 
tados, los organismos adquieren conocimiento acerca de las disposiciones espa- 
ciales y las regularidades de los eventos en su mundo, que en apariencia no se re- 
duce a vínculos de estímulo-respuesta. La insistencia de que todo el conocimiento 
puede reducirse a asociaciones de estímulo-respuesta parece ser un error difundi- 
do por los primeros fundadores de la teoría conductista del aprendizaje. En su celo 
por alcanzar la objetividad y en su afán de expulsar las temidas ““ideas'” men- 
talistas de Su teorización psicológica, los primeros conductistas opeyacionalizaron 
el conocimiento (el producto del aprendizaje) en términos de respuestas conduc- 
tuales. Sin embargo, esto identifica (¿confunde?) el conocimiento que una persona 
tiene acerca de algún evento con las ejecuciones (conductas) que emplea para indi- 
car ese conocimiento. Pero sabemos que si le enseño a usted un nuevo hecho (por 
ejemplo, “la población de Chicago es ahora de 3 400 000 habita:tes””), usted 
puede demostrar su conocimiento de ese hecho o utilizarlo de diversas formas, en 
apoyo de muchas ejecuciones diferentes. Sin embargo, estas respuestas per se no 
tienen similitud unas con las otras, El problema básico es que el conocimiento con- 
ceptual al parecer no es reducible a respuestas específicas para estímulos es- 
pecíficos. 

En diversas partes de este libro hemos aludido a varias críticas de la teoría del 
condicionamiento E-R de la conducta, de manera que resulta apropiado resumirlas 
aquí. No obstante, enunciemos la versión específica de la teoría E-R que estamos 
criticando. Tiene las tres premisas siguientes: 


A1. Los únicos elementos requeridos en una explicación psicológica pueden co- 
locarse en correspondencia de uno a uno con elementos potencialmente ob- 
servables. Estos elementos deben ser estímulos o respuestas observables o 
deducibles de ellos. (Ejemplos de derivaciones serían las respuestas mediado- 
ras, las respuestas encubiertas, los estímulos producidos por respuestas, 
etc.) 

A2. Los elementos mencionados én la premisa A1 se conectan o asocian si, y 
sólo si, ocurren contiguamente en el tiempo o el espacio objetivos. 

A3. Toda la conducta observable puede explicarse al encadenar los vinculos 
asociativos mencionados en la premisa 42. 


Bever, Fodor y Garrett (1968) denominaron a estas tres premisas los meta- 
postulados terminales de la teoría E-K, que abreviaremos como MPT. Aunque hay 
algunos factores subsidiarios, como el nivel de impulso, incentivo, etc., que a me- 
nudo se conciben en el sentido de que afectan la “fuerza*” de las conexiones E-R 
relevantes; las principales entidades teóricas que componen e integran la conducta 
en marcha son las conexiones E-R. 


Refutación de los MPT 
Los MPT pueden refutarse. Básicamente, cualquier ejecución humana refutará los 
MPT si, a fin de explicar la ejecución, debemos postular elementos internos de 
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control o de almacenamiento que no sean estímulos ni respuestas. En esta cate- 
goría casi cualquier ejecución está controlada por ““computaciones prolongadas”, 

Esos contraejemplos abundan. Uno sencillo es éste: las personas pueden apren- 
der a discriminar o a generar hileras de símbolos en las cuales concuerden los pri- 
meros y los últimos elementos. Así, si estuviéramos limitados a letras, hileras 
como XX o XAYX o XYZPX serían casos positivos, mientras que XY o XXY o 
XXXYXY no lo serían. La regla que describe con facilidad, pero ¿cómo habrá de 
caracterizarse la ejecución exitosa en términos E-R? Los estímulos son letras, y 
también las respuestas. Pero ¿cómo decimos en términos E-R que la primera le- 
tra de la hilera debe igualarse con la última? Claramente, necesitamos la noción de 
variable abstracta, así como la habilidad para seleccionar el primero y último ele- 
mentos de una serie. La regla podría estipularse aproximadamente en estos tér- 
minos: “Si la primera letra es la variable U, la última es la variable V, y U = Y, en- 
tonces es un caso positivo””. En esta regla, U' denota una variable local nominal 
que ha de ser completada por (o vinculada con) la primera letra en este ensayo, y 
comparada con la conexión para la última letra en este ensayo. Pero la idea de una 
variable local como U o Y no es en sí misma un estímulo ni una respuesta, sino 
más bien un poseedor de lugar lógico en una computación simple. Así, la ejecución 
que ejemplifica esas reglas de igualación del primero con el último, infringe los 
MPT. 

Bever y sus asociados (1968), y Anderson y Bower (1973) describen algunos 
ejemplos más poderosos de las ejecuciones humanas gobernadas por reglas que 
infingen los MPT. Un ejemplo es la discriminación de hileras de una imagen-espejo, 
en la que la persona aprende a categorizar o a generar hileras de símbolos de cual- 
quier longitud dependiendo de si su última mitad constituye la imagen en el espejo 
de la primera mitad (por ejemplo, abecba). A un sujeto humano se le puede ““pro- 
gramar”” para que proceda así; al darle cualquier serie corta, por ejemplo, xyz, 
puede repetirla de memoria hacia atrás y después hacia adelante. El problema es 
que el introducir un símbolo temprano en una serie positiva nos obliga a tener a su 
compañero en un punto indefinidamente posterior en la secuencia, y éste y otros 
compromisos deben recordarse a medida que se generan muchos símbolos inter- 
medios; sin embargo, con la práctica, los sujetos podrían generar series extre- 
madamente largas. Las series de imagen en el espejo pueden generarse mediante 
una memoria push-down stack, dispositivo que almacena símbolos y los recupera 
en un principio de último dentro-primero fuera. Ásf, para generar cdccdx, la me- 
moría generaría una x y almacenaría un símbolo de x en el stack, luego generaría 
una d y almacenaría un símbolo de d, después generaría una c y almacenaría un 
símbolo de c, y por último vaciaría los tres símbolos del stack y generaría asílos úl- 
timos tres símbolos en el orden cdx. Estas entidades y las operaciones que se aca- 
han de describir infringen parte de los MPT. Por ejemplo, los símbolos £ y d alma- 
cenados en la memoria push-down no son '*respuestas** en el sentido estándar, ya 
que las respuestas estándar constituyen eventos discretos limitados por el tiem- 
po, no representaciones internas que residen durante periodos indefinidos en los 
stucks push-dorwn de la memoria. 

El ejemplo de la imagen en el sujeto sólo destaca las dificultades que las ““contin- 
gencias remotas”” crean una visión orientada a la superficie de la conducta se- 
cuencial, Por supuesto, muchas reglas de expresiones gramaticales (por ejemplo, 
el sujeto y el verbo de la oración deben concordar en número) requieren que el su- 
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jeto que habla y escucha siga con atención esas dependencias remotas; para ha- 
cerlo así es necesario que postulemos elementos que no sean respuestas ni es- 
tímulos. 


Tipo» versus símbolos 

Un elemento dado (tipo) puede aparecer en muchos contextos distintos, y cada 
ocurrencia se denomina símbolo de ese tipo. Así, la palabra ““ocurrencia”” tiene 
dos símbolos de la letra c, dos de la r, uno de la e, etcétera. A fin de representar 
patrones o series de elementos recurrentes, nuestra memoria debe ser capaz de 
crear un número indeterminado de símbolos para representar un tipo en un con- 
texto dádo, y cada símbolo señala su tipo matriz. Sin tales distinciones entre sím- 
bolos diferentes del mismo tipo, nuestra memoria no podría deletrear palabras 
como puerta o cosquillear, y confundiría diversos contextos que usen el mismo 
tipo. En la figura 13.1 se ¡lustra el problema. Supóngase que la persona quiere re- 
cordar las secuencias rojo-azul-verde y amarillo-azul-marrón. El prublema con el 
diagrama asociativo de la figura 13.1a es que también genera hileras incorrectas 
como rojo-azul-marrón. El diagrama inferior, figura 13.15, ilustra las asociaciones 
entre símbolos en las cuales la primera y la segunda secuencias utilizan distintos 
símbolos del concepto azul. Esta estructura asociativa nos permite una ejecución 
senal sin errores. 


Rojo Verde 


A 
A 


Amarllio (a) Marrón 


Figura 13.1. Diagramas asociati- 

vos para registrar dos series de 

eventos, rojo-azul-verde y amari- flojo Azul Verde 
llo-azubmarrón. a) Este cuadro 
no emplea la distinción tipo-sim- 
bolo, y por eso las dos series se 
confundirán. b) Este cuadro usa 
la distinción tíipo-símbolo (circu- 
los), y por lo tanto mantiene re- 
gistros separados de los dos con- 
textos para el concepto “azul”. (w 


Amarillo Marrón 
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Etlquetación de relaciones asociativas 

Las personas pueden efectuar con rapidez asociaciones específicas de una pala- 
bra de estímulo, como lo contrario de X, una instancia de Y, etcétera. Esto se fa- 
cilitaría si las asociaciones entre los conceptos se etiquetaran de acuerdo con su 
tipo, y si tal relación pudiera dirigir la búsqueda específica de una respuesta. Esto 
entra en conflicto con la opinión tradicional, que sólo permitía asociaciones no eti- 
quetadas y homogéneas. 


La unidad Iuncional de respuesta 

Los conductistas tienen grandes dificultades para especificar sin ambigúedades 
la unidad de respuesta sobre la cual se concentrarían las teorías £-R, Incluso en la 
caja de Skinner, la unidad de respuesta puede caracterizarse a un nivel molar 
(picoteo en la llave) o a un nivel micromolar (tasas momentáneas diferentes de 
tiempos interrespuesta), en términos de patrones musculares micromoleculares o 
en términos de secuencias de patrones de tiempos interrespuesta (Shimp, 1975). 
Al parecer, la respuesta no es tal dato de teoría neutral. 


Acciones versus respuestas 

Una larga tradición filosófica (Goldman, 1970; Taylor, 1964) sostiene que el 
concepto de una respuesta (reacción o movimiento) es un tipo lógico que difiere de 
las nociones usuales de acción intencional mediante las cuales los legos se refieren 
ala conducta. Esta distinción filosófica es paralela a la que existe entre las res- 
puestas voluntarias y las involuntarias, entre las acciones voluntarias y las forza- 
das (o automáticas). La distinción es importante porque la sociedad no responsa- 
biliza a las personas de sus respuestas involuntarias, pero sí de las voluntarias. De 
modo similar, las expresiones verbales como “mi gato tiene manchas”” nunca se 
tratan como reacciones tales como reflejos rotulianos o lágrimas provocadas por la 
cebolla. Así, no tiene sentido preguntar si una reacción es verdadera, significativa 
o pragmáticamente apropiada en una situación social, aunque nos lo preguntemos 
rutinariamente acerca de las expresiones verbales. El argumento es que no pode- 
mos caracterizar de modo apropiado lo que alguien hace al referirnos sólo a sus 
movimientos musculares, sino que por lo común describimos la meta o intención 
aparentes de una acción, y los movimientos individuales adquieren significación en 
virtud de su papel en ese plan. El lector puede imaginar la descripción (o el escu- 
char) las jugadas en un partido de futbol americano en un nivel de movimientos in- 
dividuales descoloridos, en contraposición a las acciones intencionales que encajan 
en aparentes planes. En contraste con los conductistas £-R, Tolman y los psi- 
cólogos cognoscitivistas por lo general se han puesto de parte de los legos y de los 
filósofos en este tema, y han aceptado la premisa de que las acciones intencionales 
son las unidades apropiadas de análisis para la teoría del aprendizaje. 


Problemas con la ley del efecto 

La ley del efecto tiene una carrera larga y controvertida, y muchas de las polé- 
micas que ha suscitado se discutieron en los capítulos 2 y 9. Para los aprendices 
humanos, las recompensas aparentemente motivan la ejecución; promueven el 
aprendizaje debido, en gran parte, a que informan al sujeto acerca de lo que debe 
atender, repetir y aprender (véase la investigación de Estes citada en el capítulo 
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2). El punto de vista inicial de Phorndike, según el cual las recompensas y castigos 
contingentes fortalecen o debilitan de modo automático e inconsciente las res- 
puestas, al parecer no es aplicable a los sujetos humanos. Éstos aprenden pocas 
contingencias de las que permanecen conscientes (véase Brewer, 1974); cuando 
las contingencias repercuten sobre la conducta humana, la persona generalmente las 
deduce, y responde para obtener las recompensas ofrecidas. Es más probable 
que el aprendizaje sea un proceso cognoscitivo consciente que un proceso incons- 
ciente directo. Por otra parte, una vez que una reacción emociona) se ha condicio- 
nado con fuerza, la descripción verba) que una persona haga de ella o la compren- 
sión de su falta de sentido quizá no disminuya su excitación. Así, alguien que tenga 
fobia a las serpientes puede ser incapaz de controlar su pánico aun cuando a nivel 
verbal ''sepa”” que la serpiente es inofensiva. 


Problemas con lo contigúidad 

Los MPT suponen que los elementos entran en asociación sólo si se dan contigua- 
mente en el tiempo y espacio objetivos, En la actualidad se conoce un elevado nú- 
mero de contraejemplos de esta premisa. En primer lugar, están las numerosas 
demostraciones de pertenencia, en las cuales los elementos parecen objetiva- 
mente contiguos pero no están asociados porque los ““codificadores perceptua- 
les”? no los organizan juntos como grupo. En segundo lugar, se cuentan los resul- 
tados del bloqueo y del sombreado (capitulo 9) en los cuales la contigiidad EC-El 
no basta para crear ninguna asociación entre ellos si el EC se presenta sólo junto 
con un predictor más fuerte del El. Tercero, ahora tenernos muchos casos en los 
cuales dos eventos que no son objetivamente contiguos de todas formas se aso- 
cian, porque sus representaciones mentales se unen en la '*contigilidad mental". 
Ejemplo de esto es la timidez condicionada frente al cebo que estudiaron Revusky 
y García (1970), donde el animal asocia un sabor nuevo con la náusea que sufre 
varias horas después. Jacoby (1974) ha estudiado en el laboratorio de aprendizaje 
humano el aprendizaje análogo creado por pareamientos mentales de eventos dis- 
tantes. El lector comprenderá que las dificultades citadas para el principio de la 
contigliidad simple se refieren a la premisa A2 de los MPT; también constituyen 
problemas para una teoría E-E o cognoscitiva que sólo usara el 42 corno su princi- 
pio del aprendizaje. 


Necesidad de nodos de nivel supertor 

En el capítulo 6 se mencionaron algunas concepciones alternativas de las asocia- 
ciones que implican sólo ideas básicas en conexiones horizontales, en contrapo- 
sición a los bloques abstractos de elementos en relaciones verticales o jerárquicas. 
Al construir un sistema de memoria, el diseñador necesita algún medio econó- 
mico para referirse a los grupos de elementos interrelacionados. Esto se logra 
mediante nodos de bloques (o patrones) que reúnen grupos de elementos básicos. 
Así, al registrar en la memoria la serie de bloques (ZPH) (BXT), es conveniente, 
en teoría, tener una sola unidad de memoria que represente la serie comple- 
ta (S), unidades que representen los grupos (G, y G,) y, finalmente, unidades 
que representen los mismos símbolos de letras. De este modo, las series se re- 
presentarían jerárquicamente como: S-(G,, G¿), G,+(Z, P, By, G,+(B, X, T). 
Los nodos de bloques permiten al sistema de memoria tratar a estos grupos 
como unidades, reconocerlos cuando aparezcan en otros contextos, producirlos corno 
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unidades integradas, y modificarlos o expandirlos. Generalmente, los conceptos 
más complejos (por ejemplo, un lanzamiento de pelota í0 strike) en el beisbol) están 
integrados a partir de relaciones entre varios conceptos más simples (estatura, 
base meta, altura hasta las rodillas del bateador, etc.). Si todos estos elementos 
han de representarse en la memoria de una persona (ya que conocemos y habla- 
mos acerca de tales conceptos), resulta sumamente económico usar una sola uni- 
dad (símbolo) para referirnos a un concepto complejo (como un lanzamiento en el 
beisbol). Pero hacerlo requiere que se permitan asociaciones verticales a los nodos 
de bloques (véase la figura 6.15), así como las asociaciones horizontales entre ele- 
mentos, ideas, objetos o propiedades. 

Esta breve lista de dificultades en una teoría de condicionamiento E-R de la con- 
ducte no es completa mu exhaustiva (para ampliarla, véase Anderson y Bower, 
1973, o Brewer, 1974), pero expone a los estudiantes a algunas complicaciones 
históricamente importantes. También hemos observado que la teoría E-R parecía 
incapaz de tratar con los hechos elementales de la memoria humana. Chomsky 
(1959) y otros han argumentado con vehemencia que la teoría E-R no está en ap- 
titud de manejar la infinidad de regularidades de nuestras habikdades comunes en 
el lenguaje. Por estas razones, muchos investigadores modernos del aprendizaje 
han abandonado una teoría estricta E-R del condicionamiento para adoptar una 
versión muy liberal de la misma (por ejemplo, Bandura, 19712, 1977a; Staats, 
1968, 1975) o la teoría cognoscitivista. En las secciones siguientes examinaremos 
los ternas principales y las directrices que orientan a la psicología cognoscitivista 
moderna, y prestaremos una atención especial al trabajo realizado en torno de la 
memona humana. 


PSICOLOGÍA COGNOSCITIVISTA 


La psicología cognoscitivista se interesa por la forma en que los organismos 
conocen (obtienen conocimiento acerca de) su mundo, y la manera en que emplean 
ese conocimiento para guiar decisiones y ejecutar acciones efectivas. Los psicó- 
logos cognoscitivistas intentan comprender la ““mente”” y sus habilidades o logros 
en percepción, aprendizaje, pensamiento, y en el uso del lenguaje. Con este fin, 
postulan teorías acerca de sus funcionamientos interiores. La mayoría de los psi- 
cólogos cognoscitivistas siguen el enfoque del procesamiento de información que 
hemos examinado en el capítulo 12, y consideran al cerebro humano como un tipo 
de computadora; al igual que ésta la mente posee múltiples niveles de organización 
(analizadores de características, reconocedores de patrón, memorias sensoriales 
o conceptuales), y en uno de ellos podemos concebiria como un sistema proce- 
sador de símbolos. Un sistema mental de símbolos puede representar interna- 
mente al medio ambiente, construir patrones de símbolos (por ejemplo, propo- 
siciones) de cualquier complejidad para representar escenas o eventos en el 
mundo, puede almacenar estas estructuras simbólicas en la memoria con uno o 
más indicadores, recuperar una estructura usando una clave apropiada de indi- 
cador, y manejar o transformar estas estructuras simbólicas en la actividad que 
denominamos pensamiento. 

Los componentes básicos de un sistema de procesamiento de información son 
los receptores sensoriales que reciben entradas del medio ambiente, las unidades 
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efectoras que producen respuestas, un almacén de memona que guarda estruc- 
turas de datos o programas de acción y un procesador central en el cual tienen 
lugar las principales actividades mentales: pensamiento, juicio y toma de deci- 
siones. 

En la figura 13.2, se muestra un diagrama típico del sisterna cognoscitivo huma- 
no donde las flechas entre los componentes sugieren el flujo de información y de 
control. El diagrama se comprende mejor al movernos por él como si un estímulo 
se aprendiera o evaluara para algún juicio. Un evento de estímulo ambiental se re- 
gistra brevemente en separadores sensoriales, y pasa entonces por un proceso de 
reconocimiento o clasificación que intenta igualar la entrada con patrones (o re- 
glas) conocidos en la memoria, o trata de describir el patrón entrante en términos 
de conceptos elementales (por ejemplo: **viene un hombre montando en bici- 
cleta*”), Sila atención se dirige al evento, su descripción interna se mantiene ac- 
tiva en la memoria de corto plazo durante un tiempo. La memoria de corto plazo 
(MCP) es la parte activada de los conceptos en la memoria, y en términos gene- 
rales corresponde a lo que queremos decir con conciencia (sin embargo, la infor- 
mación puede estar en la memoria de corto plazo y no en la conciencia). Cuando la 
descripción del estímulo entra en la MCP, un ““programa'” activo trata con el 
evento, tal vez al juzgarlo, nombrarlo, repetirlo, o aprenderlo si es pertinente, y al 
ignorarlo si no lo es, 

La memona de funcionamiento, a la derecha en la figura 13.2, mantiene infor- 
mación acerca del contexto local, pero esta información no se encuentra en el foco 
de la memoria activa ni en los nichos distantes de la memoria de largo plazo. La 
memoria de funcionamiento estructura y mantiene un modelo interno del ambiente 
inmediato, como lo que ha sucedido durante los últimos minutos. Este modelo es 
la estructura dentro de la cual se producen los cambios más rápidos del mundo 
perceptual ante nosotros, lo cual hace que actualicemos nuestro modelo del con- 
texto que nos rodea, 

El sistema cognoscitivo se desarrolló en la historia humana a través de la evo- 
lución. Pero este desarrollo también se lleva a cabo dentro de la vida de cada per- 
sona; el sistema cognoscitivo actúa como un instrumento de ajuste y como ayuda 
para guiar la acción intencional. Los sistemas cognoscitivos sirven a estos pro- 
pósitos al adquirir información acerca del mundo, y entonces construyen planes de 
acción basados en las contingencias en esta información. Dichos planes son como 
programas de computadora que residen en la memoría y que pueden llamarse a la 
memoria de funcionamiento a fin de orientar las acciones emprendidas como res- 
puesta a los contenidos activos de la MCP. Por lo tanto, el sistema cognoscitivo 
es capaz de programarse a sí mismo para adaptarse y actuar adecuadamente en su 
medio ambiente. 


La información en la memoria de largo plazo 


La memoria de largo pluzo (MLP) es la depositaria de nuestros conocimientos y 
habilidades más permanentes; contiene todo lo que conocemos y que actualmente 
no se encuentra en la memoria activa. La información en la MEP es de tres tipos: 
conocimiento sensorioperceptual, conocimiento procesal motor y conocimiento 
proposicional (o creencias). 
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Conocimiento sensoriopercepiual 

El conocimiento sensorioperceptual se representa de forma análoga en nuestro 
almacén de inforniación sensoria). Se emplea en la clasificación de patrones senso- 
riales y en el almacenamiento de recuerdos de sensaciones. Cuando estas estruc- 
turas de información se activan internamente, son responsables de la experiencia 
de generar imágenes y de procesarlas en la imaginación. Junto con las imágenes 
de los objetos, este almacén también mantiene mapas cognoscitivos de las dispo- 
siciones de éstos en el espacio para varias localidades. 


Conocimiento procesal motor 

El conocimiento procesa) motor es el conocimiento de cómo hacer algo, desde 
las habilidades motoras (montar en bicicleta) a las intelectuales (resolver ecua- 
ciones lineales), hasta la producción de lenguaje. Un enfoque representa estas ha- 
bilidades en la memoria en términos de una jerarquía de producciones (reglas). Una 
producción es como una regla generalizada de estímulo-respuesta, sólo que más 
poderosa (véase el capítulo 12), Una producción, simbolizada como '*condicio- 
nes—acciones”, tiene una o más condiciones que deben ser verídicas de los con- 
tenidos de la MCP para que se seleccione y ejecute. Cuando se ejecuta una pro- 
ducción, ocurren una o más acciones, que pueden Ser respuestas abiertas o internas 
como el continuar un cálculo mental o recuperar algo de la MLP y hacerlo activo 
enla MCP. 

Una producción sencilla, como un par condición—acción, puede concebirse 
como una instrucción simple. Las secuencias de producciones son entonces como 
programas de computadora almacenados que logran algún resultado; por ejemplo, 
buscar en la memoria la respuesta a una pregunta, calcular el producto de dos nú- 
meros de doble digito, memorizar una serie de letras, hornear un pastel, etcétera. 
Las instrucciones experimentales para los sujetos humanos se conciben en el sen- 
tido de que causan que el sujeto eree una secuencia de producciones que actúa 
como un programa interno para permitirle llevar a cabo la tarea experimental. El 
lado de condición de las producciones puede referirse a eventos sensoriales (ya 
sean aferentes o eferentes) o a ideas (patrones de conceptos activos) en la MCP. 
Cuando se ejecuta, la producción puede entonces activar otras ideas o transformar 
las que están en la conciencia. De este modo, las producciones se emplean para 
describir el flujo de ideas asociadas a través de la conciencia, ya sea en el trans- 
curso de la planeación dirigida a una meta o durante las fantasías de realización de 
deseos. Es importante notar que las producciones proporcionan las estructuras de 
control que necesita cualquier teoría cognoscitiva, ya que las producciones son 
responsables de desempeñar movimientos o transiormaciones sucesivas en el 
pensamiento, la solución de problemas y la planeación. Por ejemplo, las estruc- 
turas de contro! supervisan el proceso de planeación al monitorear su avance, 
decidir cuándo abandonar una línea y tomar otra, etcétera. Estas decisiones se ac- 
tivan mediante condiciones relativamente simples (por ejemplo, demasiado tiempo 
transcurrido). Los mecanismos relativos a la supervisión y orientación de la ope- 
ración del sistema cognoscitivo tradicionalmente ni siquiera se han reconocido o 
explicado en la teoría £-R. Una atractiva característica de las teorías contempo- 
ráneas como el modelo ACT, de Anderson (1976), es que intentan establecer en 
detalle los procesos de control. En un experimento de aprendizaje humano, como 
ejemplo de un procesa controlado, figura la selección que hace el sujeto de una es- 
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trategia de memorización para usarla en la solución del problema de aprendizaje 
que el experimentador le describe. 


Creencias proposicionales 

El tercer tipo de información en la memoria es declarativa e incluye creencias 
acerca de nosotros mismos y de nuestro mundo, nuestro conocimiento de los con- 
ceptos y significados de las palabras, conocimiento de hechos generales y de obje- 
tos específicos, eventos y episodios. Una creencia es una proposición con un valor 
subjetivo de verdad o credibilidad vinculada con ella, como: “Yo creo que Buda vi- 
sitó Persia”. Una proposición de valor implica un predicado primitivo de la forma: 
“Yo valoro X””, es un concepto, una creencia o un posible estado de cosas. Cier- 
tos estados de cosas se valoran recurrentemente como resultado de la privación. 
De este modo, los motivos biológicos entran en el sistema. 

En las teorías cognoscitivas, la información proposicional suele representarse 
en términos de redes semánticas (o conceptuales). Una proposición establece una 
relación entre conceptos preexistentes, como: “John besó a Mary” o 'John 
compró un automóvil”, La premisa en las teorías como la ACT es que los eventos 
de estímulo entrantes son analizados por el sistema perceptual, que entonces en- 
trega una descripción proposicional de esa entrada a la memoria. Así, el “dinero 
del reino'”, que entra y sale de la memoria, está constituido por proposiciones. 
Las proposiciones son abstractas y estructuradas, y tienen un valor verdadero, 
Pueden representarse en términos de redes de asociaciones etiquetadas entre 
símbolos de conceptos preexistentes. Volveremos a tratar a estas redes sernánti- 
cas en otra sección de este mismo capítulo, 


Las estrategias de aprendizaje como 
procedimientos 


Las teorías cognoscitivas distinguen entre la parte de registro pasivo de la me- 
moría y la estrategia de memorización activa que el aprendiz aplica en el momen- 
to para tratar con su tarea experimental, una porción de la cual puede requerir que 
registre algunos materiales en la memoria de largo plazo, Si la memoria es un tipo 
de biblioteca, la memoría pasiva es la colocación real de un nuevo libro en el es- 
tante; la estrategia de aprendizaje sería análoga a la política de la biblioteca en lo 
que toca al manejo y elaboración de índices de libros nuevos para el catálogo de 
tarjetas, antes de colocarlos en los anaqueles, La investigación de las estrategias 
del aprendizaje es un desarrollo relativamente reciente (véase O'Neil, 1978 y la 
discusión acerca del aprendizaje verbal mediado en el capítulo 6). Puede demos- 
trarse que, después de la exposición a los materiales experimentales, el que los 
sujetos humanos aprendan algo —y, de ser así, cuánto y qué partes— varía críti- 
camente de acuerdo con las estrategias cognoscitivas que empleen para tratar con 
los materiales. Algunas estrategias (corno la elaboración semántica de palabras) 
pueden producir grandes cantidades de memoria como producto secundario inci- 
dental del procesamiento; otras crean relativamente poca memoria con indepen- 
dencia de la intención de aprender que tenga el sujeto. Los seres humanos pueden 
adquirir una batería de estrategias de aprendizaje o habilidades que aplican cuando 
las circunstancias, motivos y materiales lo requieran. Además, es probable que 
entre la gente existan grandes diferencias en el aprendizaje de habilidades, lo cual 
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depende de estrategias particulares o habilidades y conocimientos específicos que 
hayan adquirido antes de que se les compare en alguna prueba. 


Desarrollo de la memoria durante la infancia 


Los recién nacidos muestran una memoria moderada por patrones auditivos, 
táctiles y visuales burdos (como lo indica su posterior falta de interés en un patrón 
de prueba familiar). Desde este punto de partida, las habilidades de aprendizaje se 
incrementan de modo constante durante toda la niñez, El desarrollo de la habilidad 
de memoria ha sido ampliamente investigado par los psicólogos infantiles (Flavell, 
1976), y se le ha descrito de forma esquemática. Á continuación veremos algunos 
de sus aspectos esenciales. 

En primer lugar, la memoria mejora porque el sistema conceptual puede '“sos- 
tenerse por sí solo'”; mientras más objetos, patrones y conceptos reconozca 
como unidades en la memoria, más fácil le será aprender cosas nuevas acerca de 
estos conceptos y de las relaciones entre ellos, o usarlos en nuevas configuracio- 
nes. (Recuérdese que una proposición es tia nueva configuración de conceptos 
existentes.) Cuanto más conceptos posea un niño, más probabilidades tendrá de 
comprender nuevas instancias de cualquier concepto y de no confundirse con los 
eventos. El desarrollo conceptual se lleva a cabo mediante la especialización (o di- 
ferenciación) de categorías amplias, y al generalizar en distintas subcategorías. 
Mientras más rica y diferenciada sea la red conceptual de un niño, más descrip- 
tores proporcionará su mente automáticamente para nuevos eventos que se ciñan 
a las categorías conocidas; este proceso da lugar a más conexiones del evento 
nuevo dentro de conceptos preexistentes en la memoria. Hipotéticamente, esas 
vinculaciones múltiples deberían mejorar la memoria para los eventos así conecta- 
dos. Este '*aprendizaje por comprensión”” no intencional se produce en la mayor 
parte de nuestra vida consciente y se fomenta mediante estrategias deliberadas. 
Los procesos que acabamos de describir son similares a las nociones de Piaget de 
asimilación y acomodación (Piaget, 1954). 

Además de este sistema conceptual en desarrollo, de los 2 a los 6 años de edad 
el niño parece adquirir conceptos de tiempo, pasado, memoria, olvido, y su falibili- 
dad; durante esta época también comienza a configurar estrategias de memoria 
para retener información importante. Un niño de unos 3 o 4 años probablemen- 
te no comprenda la diferencia entre las instrucciones de mirar algo versus 
memorizarlo. Sólo con la experiencia llega a comprender que '“memorizar las 
ilustraciones'” significa *hacer algo con ellas, de modo que más adelante sea ca- 
paz de reproducir sus nombres''. Conforme maduran, en particular cuando en- 
tran en las escuelas formales, los niños adquieren métodos primitivos de aprendi- 
zaje y luego otros cada vez más complejos. Algunas estrategias que utilizan para 
recordar los nombres de una colección de objetos ilustrados serían las siguientes 
(en grado creciente de complejidad): 


2) Prestar atención a las ilustraciones una por una. Contemplarlas. 
b) Nombrar cada ilustración una vez cuando se presenta. 

c) Nombrar cada ilustración aisladamente y en repetidas ocasiones, 
d) Nombrar reiteradas veces las ilustraciones en secuencia. 
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MODELO DE LA MEMORIA DE CORTO PLAZO 


Durante los últimos veinte años se ha acumulado un gran conocimiento empírico 
a partir de estudios de la memoria inmediata, donde el recuerdo de información que 
un sujeto humano tiene se comprueba pocos segundos después de realizado el ex- 
perimento., Si sólo intervienen uno o dos reactivos verbales, el sujeto usualmente 
muestra un exacto recuerdo inmediato. Además, siempre que no se distraiga, 
mostrará un recuerdo perfecto durante un intervalo de 30 a 60 segundos. Pero si 
por alguna razón se distrae (al tener que responder a otro material), su habilidad 
para recordar la primera información disminuye precipitadamente en el transcurso 
de escasos segundos. A la mayoría de nosotros tales fenómenos nos resultan fa- 
miliares; después de ver un número telefónico o una dirección, la olvidamos si 
algo nos distrae antes de que los hayamos escrito o usado. En la figura 13.3 se 
muestra una medición de este efecto en el laboratorio. En un experimento de L. 
R. Peterson y M. J. Peterson (1959), al sujeto se le presentaba brevemente un 
trigrama sin sentido (por ejemplo, CHA), y se le daba un problema aritmético 
(restar sucesivamente 3 de un número aleatorio) antes de que se le pidiera re- 
cordar el trigrama. La curva muestra la probabilidad disminuida de que el trigrama 
se recordara correctamente después de intervalos de hasta 16 segundos dedi- 
cados a la resta sucesiva. 

Los fenómenos de este tipo han estimulado muchas investigaciones experi- 
mentales. Al parecer, los resultados implican una MCP de extrema fragilidad, que 
dura sólo unos cuantos segundos cuando se presenta material de distracción. 
Pero, ¿cuál es el uso funcional de este sistema de MCP en la economía global de la 
mente? ¿Qué relación guarda con muestra MLP? ¿Cómo describiremos su opera- 
ción? ¿Cuáles son sus leyes? Éstas y otras preguntas han inspirado algunas inte- 
resantes hipótesis y un cúmulo de experimentación. 

Con un conjunto tan rico en resultados sistemáticos, no pasó mucho tiempo an- 
tes de que se elaboraran teorías para explicarlos. El enfoque dominante ha sido 
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tratar a la MCP como un almacén de memoria separado, o poseedor de informa- 
ción, distinto de la ML.P. Las primeras formulaciones de este modelo de dos alma- 
cenes corresponden a Broadbeni (1957), Waugh y Norman (1965), y G. H. Bower 
(19674). La enunciación más extensa y sistemática de lo que había de convertirse 
en la teoría estándar de la “memoria dual”? se debe a Atkinson y Shiffrin (1965, 
1968). 

En la figura 13.4 se muestra un diagrama de bloque simplificado de los alma- 
cenes de memoria postulados en el modelo separador de Átkinson-Shiffrin. (Es 
sólo una ligera variación del sistema que aparece en el diagrama de la figura 13.2.) 
En primer término se analiza una entrada de reactivo de estímulo al sistema per- 
ceptual; después se identifica y, si se le presta atención (por los procesos de con- 
trol), un código interno para él entra en la MCP activa. La MCP tiene una capaci- 
dad limitada, y a lo sumo sólo da cabida a unos cuantos reactivos de información. Si 
los reactivos en la MCP deben conservarse, los procesos de control inicían algún 
tipo de actividad mnémica, como la repetición. Para los materiales verbales, tales 
repeticiones sin duda consisten en repasar subvocalmente los nombres de los 
reactivos para refrescar su activación en la MCP. Además, se supone que cada ci- 
clo de repetición puede transferir, dentro de una MLP más permanente, infor- 
mación acerca de la presencia del reactivo en la lista que ha de memorizarse. La 
MC?P puede concebirse como el conjunto de nodos activados en la memoria me- 
diante la repetición o como un lugar en el cual se produce una reiteración activa y 
subvocal del materia); como este repaso insume tiempo y la MCP posee una capa- 
cidad limitada, es posible que sólo haya tiempo suficiente como para repasar unos 
cuantos reactivos (por ejemplo, tres o cuatro palabras) antes de que llegue el si- 
guiente. Una tarea distractora como resolver problemas de aritmética requiere de 
atención y también introduce nuevos materiales en la MCP, lo cual limita la canti- 
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Figura 13.4. Diagrama de los componentes de almacenamiento y de los procesos de 
control que comúnmente se presuponen en las modernas teorias de la memoria. Para 
una explicación, véase el texto 
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dad de esfuerzo de procesamiento que resta para la repetición del material previo 
que se ha de recordar. 

Así, un reactivo por ser recordado (PSR) a la larga es sustituido o se pierde de la 
MCP, porque esta última debe tratar con información nueva. Cuanto mayores 
sean las exigencias de la tarea interpolada (mientras mayor sea su dificultad), más 
atención le quitarán a la repetición, y más rápidamente se eliminará el material 
PSR de la MCP. En las circunstancias que impliquen matenal interpolado homo- 
géneo, por lo general se supone que cada reactivo interpolado (por ejemplo, cada 
paso sucesivo al restar 3) tiene alguna probabilidad fija de hacer que un reactivo en 
la MCP se desplace o se saque de la MCP. Esta formulación conduce a una pérdi- 
da exponencial de reactivos de la MCP conforme transcurre el tiempo o cuando 
aparece una distracción. 

Este cuadro del aprendizaje y del olvido es un tanto parecido a una cola de clien- 
tes que demandan un servicio (véanse G. H. Bower, 19674; J. S. Reitman, 1971). 
Los clientes, que representan reactivos PSR, llegan periódicamente y exigen ser- 
vicio inmediato por parte de un número limitado de dependientes (huellas de re- 
petición). Es posible que el servicio a un primer cliente se interrumpa si llega uno 
nuevo antes de que la atención de aquél haya terminado, y su dependiente (huella 
de repetición) se escoge para que se ocupe del recién llegado. Un cliente que re- 
cibe un servicio satisfactorio corresponde a un reactivo que se ha transferido a la 
MLP antes de ser retirado de la MCP. Se supone que un cliente cuyo servicio se 
interrumpe se marcha insatisfecho; este evento corresponde a un reactivo del mo- 
delo que es sacado de la MCP antes de que la información suficiente acerca del 
mismo se transfiera a la MLP, de modo que se aprenderá relativamente poco 
acerca de él. 

Este bosquejo presupone que el olvido desde la MCP se produce principalmen- 
te por desplazamiento, pero esta opinión necesita dos correcciones. Primero, la 
probabilidad de que un reactivo interpolado desequilibre un reactivo en la MCP se 
incrementa cuanto mayor sea la similitud entre ambos. Segundo, incluso sin otras 
entradas, si la intención de una persona puede dirigirse a otra cosa, los reactivos 
antiguos en la MCP parecen disminuir en fuerza hasta cierto grado. 

Veamos un ejemplo para ilustrar la operación de la MCP en términos concretos. 
1. La presentación visual de la letra £ en una lista de letras que hay que memorizar 
en orden serial se identifica como una letra familiar (patrón) y se codifica, de ser po- 
sible, como el nombre vocal ele; 2. este código de pronunciación, ele, se repite 
subvocalmente en la MCP junto con otros reactivos de letras de la lista de entrada por 
'memonzarse; y 3, la estructura de memoria establecida en la MLP puede ser una 
proposición objetiva de la forma “E se presentó en la lista más reciente””. Según 
el grado en que la estructura se construya con éxito, se recupera y se usa cuando el 
experimentador pida más tarde al sujeto que dé los nombres de las letras presen- 
tadas en la lista más reciente que ha estudiado. Por el momento, esta introducción 
es suficiente. Ahora veamos los detalles más a fondo, así como la investigación 
que los rodea. 


Codificación 

El código de la memoria es el “nombre” temporal o la representación interna 
asignada al reactivo de estímulo y depositada en la MCP. Para los sujetos que tra- 
tan con materiales verbales, esto es más a menudo el sonido o el nombre del estí- 
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slo o de una descripción verbal de él o (si se trata de una ilustración familiar) de 
una etiqueta para el núsmo. El efecto de este nombre es convertir un estímulo vi- 
sual en una forma articulatoria interna. El número de reactivos que pueden re- 
petirse en la MCP es mayor para las letras que se pronuncian con rapidez, y para 
Jas personas que hablan más rápidamente. Sin embargo, si el aparato del habla se 
encuentra ocupado en otra cosa o no opera en el momento en que se presenta vi- 
sualmente el estímulo que ha de recordarse, esta conversión visual articulataria 
no puede tener lugar, y el estímulo presentado parece conservarse en términos 
de sus propiedades físicas (visuales). Como un segundo ejemplo de la codificación 
no verbal, las personas sordas dependen del lenguaje de signus manuales y em- 
plean la codificación manual cuando deben recordar letras presentadas visualmen- 
te. En cualquier caso, la forma de esta representación interna de un reactivo meta 
determina; 1. qué otros tipos de materiales intervienen con (o causan) el olvido de 
la meta, y 2. Jos tipos de errores de confusión que la persona cometerá cuando re- 
cuerde mal el reactivo meta. Si ha codificado un reactivo de acuerdo con su 
sonido, los materiales con sonidos parecidos interferirán y son probables los erro- 
res en el recuerdo con un sonido cumo el del objetivo (por ejemplo, recordará T 
cuando debería haber sidu P, Y o B). Si se impide la codificación articulatoria de 
modo que la persona se vea forzada a codificar letras presentadas visualmente en 
términos de sus características visuales (Kroll et al., 1970; Salzberg et al., 1971), 
entonces el material interpolado provocará mayor interferencia que el visualmente 
similar al reactivo que hay que recordar (por ejemplo, KR es similar visual pero no 
acústicamente a P). De manera semejante, en las personas ciegas que usan signos 
manuales para codificar reactivos que han de recordarse, la mayor interferencia 
provendrá de los materiales interpolados que implican signos que son manual- 
mente similares al reactivo que hay que recordar (Locke y Locke, 1971). 

Los códigos de memoria en la MCP son rápidamente asequibles para la recu- 
peración, Esta pronta recuperación de la MCP se estudia en la tarea diseñada por 
Sternberg (1969; véase el capítulo 12). El sujeto escucha un pequeño conjunto de 
uno a seis reactivos meta que ha de ubicar en su MCP, oye un reactivo de '“son- 
deo”, y debe decidir si el sondeo se iguala a uno de los reactivos meta. En esta ta- 
rea, el sujeto supuestamente almacena en la MCP los códigos de los reactivos 
meta, y cuando se lleva a cabo el examen probatorio, explora en busca de un códi- 
go que lo iguale, De acuerdo con este punto de vista, el tiempo de reacción para 
los exámenes probatorios se incrementa de modo lineal con el número de reacti- 
vos en la lista de memoria (siergpre que la lista sea más corta que la capacidad de 
la MCP), y éste es el resultado estándar. Cuanto más complicados sean los teacti- 
vos (sílabas sin sentido en lugar de letras), mayor “*espacio'” ocuparán en la MCP 
de capacidad limitada, lo cual requiere que el exceso de las listas extensas se recu- 
pere de la MEP, origine un tiempo de reacción más lento en la tarea de Sternberg 
(Cavanaugh, 1972). 


Olvido intencional 

Si una persona quiere olvidar algo en la MCP (o si, más bien, no desea recor- 
darlo), sólo necesita dejar de ensayarlo y su código de memoria se desvanecerá 
poco a poco. Se ha realizado un cierto número de estudios acerca de este '"olvido 
dirigido”, y el procedimiento opera hastante bien (véanse Bjork, 1970, Epstein, 
1972). Por ejemplo, en una situación de recuerdo libre en la cual se presentan al 
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aprendiz palabras sencillas cada dos segundos y después la lista completa que ha 
de recordar en algún punto durante la entrada se le puede informar que no es res- 
ponsable de los reactivos anteriores (puede ““olvidarlos””), y que sólo tendrá que 
retener aquellos que siguen (Bruce y Papay, 1970). Varias pruebas de seguimien- 
to, entre las cuales se cuenta una solicitud inesperada de que el sujeto intente re- 
cordar los reactivos que se le había indicado que olvidara, sugieren que el “*indicio 
de olvidar"? es una señal para que el sujeto descargue de la MCP (deje de ensayar) 
todos aquellos reactivos que no tiene que recordar, de modo que éstos reciben 
menos ensayos totales y, por ende, se aprenden menos de lo normal, El sujeto es 
capaz de corregir su recuerdo sólo en aquellos reactivos que han ocurrido después 
(y no antes) del indicio de **olvidar””. Además, los datos sugieren que cuando evo- 
ca la sublista terminal, el sujeto puede ““desechar'” las huellas de la memoria de 
los reactivos anteriores, a fin de que no compitan con aquellos que hay que re- 
cordar. 


Eventos sorpresivos 

Otra forma de provocar el olvido de un reactivo o de una serie de entrada (para 
el recuerdo libre) consiste en acompañarlo de uno de gran prioridad, al cual el su- 
jeto debe prestar especial atención. Este reactivo prioritario se apropia de forma 
exclusiva del espacio de almacenamiento en la MCP, con el resultado de que 
los reactivos posteriores en la lista son un tanto menos propensos a entrar en 
la MCP y, silo hacen, tienden a expulsar a los códigos de memoria anteriores de 
menor prioridad; es decir, aquellos que entran justo antes del reactivo priotitario. 
Los experimentos de Ellis y sus colaboradores (1971) muestran ambos efectos de 
decremento sobre el recuerdo de los nombres inmediatamente anteriores (y algu- 
nos posteriores) de ilustraciones de objetos comunes, en una lista en la cual el 
reactivo de prioridad especial es la fotografía de un desnudo. Los resultados apa- 
recen en la figura 13.5, donde se observa que el reactivo crítico $e recuerda muy 
por encima de lo normal, mientras que los reactivos ubicados inmediatamente an- 
tes y después de él poseen menor recuerdo, Tulving (1969) observó sólo un de- 
cremento de reactivo previo al colocar en la lista de palabras no relacionadas que 
hay que recordar, el nombre de una persona famosa, para cuyo recuerdo se había 
apremiado especialmente al sujeto. Estos efectos pueden interpretarse como re- 
sultado de la prevención o del incremento del ensayo. Las retribuciones moneta- 
rias producen efectos similares; si a la persona se le dice durante el estudio de un 
reactivo que su posterior recuerdo valdrá mucho dinero, se concentrará considera- 
blemente más (ensayará más, mantendrá el reactivo en la MCP durante un tiempo 
mayor) y recordará mejor. La retribución afecta la asignación de una prioridad y la 
cantidad de ensayo del reactivo, y ese ensayo incide a su vez en la fuerza de su 
huella de memoria establecida (véase por ejemplo, Atkinson y Wickens, 1971; 
Loftus, 1972). 


Ensayo maniflesto 

Se ha dicho que varios efectos mnémicos se deben al ensayo diferencial del ma- 
terial apropiado. Una forma simple de operacionalizar los procesos de ensayo con- 
siste en hacer que el sujeto “*piense en voz alta”* cuando estudie la lista (Rundus y 
Atkinson, 1970; Rundus, 1971). Si se le presenta una lista de 20 palabras no rela- 
cionadas que ha de recordar libremente, y si los reactivos aparecen uno por una 2 
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Figura 13.5. Porcentaje de recuerdo de nombres de imágenes según su posición serial 
en la lista. la lista “crítica” (curva continua) contenia la fotografía de un desnudo en 
Ja posición serial 8, mientras que la lista “no crítica” (curva punteada) sólo usaba fo- 
tografías familiares y no emocionales (tomada de Ellis et al, 1971). 


un ritmo pausado de 5 segundos, los ensayos del sujeto momento a momento se 
parecerán al protocolo que se muestra en la tabla 13.1. Durante cada intervalo 
de 5 segundos el sujeto ensaya abiertamente alrededor de cuatro símbolos (el 
ensayo encubierto podría resultar mucho más rápido). A medida que se presenta 
cada palabra nueva, ésta entra en el conjunto de ensayo en marcha, otras se des- 
cartan, y Jas primeras pueden recogerse de nuevo en ensayos posteriores. Entre 
las numerosas descripciones que podríamos ofrecer de tal protorolo, quizá la 
estadística más simple sea sólo el número de veces que un reactivo dado (por 
ejemplo, el reactivo r-avo ubicado en determinado lugar en la lista) recibe un ensa- 
yo. Así, en el hipotético protocolo de la tabla 13.1, el reactivo segundo (alfombra) 
también recibía 8, el tercero (tibro) 1, y así sucesivamente. 

La curva punteada en la figura 13.6 muestra e) número promedio de ensayos de 
cada uno de los 20 reactivos sucesivos en una lista de estudio; esto está prome- 
diado para 25 sujetos, cada uno de los cuales ejecutaba un ensayo en 11 diferentes 
listas de recuerdo libre. Los valores se dan en la ordenada derecha de la gráfica y 
varían desde una media de 12 repeticiones para el primer reactivo hasta 2 repe- 
ticiones para el reactivo 21 y último. Inmediatamente después de la presentación 
de la lista de palabras, los sujetos recuerdan libremente tantas como puedan en el 
orden que deseen. La probabilidad de recuerdo de la palabra en cada posición se- 
rial de entrada se grafica en la línea continua denominada P(R). 

En esta curva de posición serial pueden notarse varias características. Primero, 
los últimos reactivos de la lista se recuerdan bien (un etecto de recencia) y la teo- 
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TABLA 13-1. Ejemplo hipotético de la repetición 
abierta de reactivos durante la entrada de la 
lísta para recuerdo libre; procedimiento 
diseñado por Rundus y Atkinson (1970). 


Reactivo 
presentado Reactivos repetidos (conjunto de repetición) 


1. perro perro, perro, perro 
1 


2 
2. alfombra alfombra, perro, alfombra, perro 
3 
3. fibro libro, alfombra, perro 
4 
4. pluma pluma, pluma, alfombra, perro 
5. barco barco, alfombra, pluma, perro 
6 7 
6. pared pared, alfombra, pared, alfombra 
8 
7. lave llave, barco, pared, alfombra 
8. bolsa bolsa, llave, barco, pared 
. . 
. + 
. e 
20. pelo pelo, calcetín, papel, pelo 


ría supone que éstos se encontraban con más probabilidad en el conjunto de repe- 
tición 21 (véase la tabla 13.1), y se recuperaron de la MCP cuando se pidió el 
recuerdo. Segundo, los reactivos iniciales en la lista se recordaban mejor que los 
reactivos medios, un efecto de primacía. Aquí es interesante observar que el nú- 
mero de repeticiones de un reactivo se correlaciona con su probabilidad de recuer- 
do, al menos para los reactivos hasta alrededor de la posición serial 14 (la MCP 
entra para incrementar el recuerdo de los reactivos posteriores). Esta correlación 
es muy fuerte incluso si sólo consideramos los reactivos cuya última aparición en 
un conjunto de repetición estaba entre 4 y 7 reactivos atrás, antes de que comen- 
zara el recuerdo. 

La interpretación estándar de dos almacenes de tales resultados es que los reac- 
tivos anteriores de “*primacía”” se recordaban bien porque poseen una alta fuerza 
enla MLP (debido a sus repeticiones extra), mientras que los reactivos posterlo- 
res de ““recencia”” se recordaban porque están en la MCP. Una implicación es que 
el recuerdo de estos reactivos recientes es más frágil, más fácil de desequilibrar: 
si se interpola una tarea distractora de aritmética durante 30 segundos entre la en- 
trada de la lista y el recuerdo, los reactivos en la MCP son removidos y se borra el 
“efecto de recencia'”. Pero el nivel del efecto primario no se ve muy afectado por 
esa interpolación. Otra implicación proviene de la ligera depresión en la curva de 
repetición para los reactivos al final de la lista. Si estos reactivos tienen menos 
fuerza en la MLP debido a la menor cantidad de repeticiones, entonces una depre- 
sión similar debería detectarse en el recuerdo muy demorado de tales reactivos. 
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Figura 13.6. La probabilidad promedio de recuerdo, P(R), y el número promedio de re- 
peticiones de un reactivo como una función de su posición de entrada serial (toma- 
da de Rundus, 1971) 


Craik (1970) encontró esa depresión de recuerdo demorado. El contraste entre el 
recuerdo más pobre de largo plazo y el excelente recuerdo inmediato de los reac- 
tivos del final de la lista acentúa la disociación que esperan los modelos MCP-MLP., 


Teoría de Jos dos almacenes y niveles 
de procesamiento 


Atkinson y Shiffrin (1968, 1971) y Glanzer (1972) han reseñado la evidencia que 
favorece a los modelos de la memoria de dos almacenes. El enfoque general se re- 
fuerza con los resultados que sugieren que algunas variables experimentales atec- 
tan a los recuerdos en un almacén, pero no a los de otro. APintroducir **procesos 
de control”” que afectan las actividades mmémicas, el enfoque también tiene la 
flexibilidad para tratar con una gama de influencias de la instrucción, estratégicas y 
motivacionales. Sin embargo, en los años siguientes el modelo de dos almacenes 
ha sido objeto de crecientes críticas y ataques experimentales; en consecuencia, 
fue modificado para tratar con nuevas consideraciones, algunas de las cuales se 
examinan a continuación. 

Primero, la disposición de las ““cajas'' que se presenta en la figura 13.4 parece 
oblicua, ya que no muestra que la información en la MEP se use siempre para el 
reconocimiento de patrón durante la percepción y la codificación iniciales; es decir, 
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el diagrama de la citada figura sugiere que la MEP emtra mucho después. Esto se 
ha manejado en diagramas como los de la figura 13.2, donde la información sen» 
sorial activa directamente la MLP; en esta concepción, la MCP no es un “lugar” 
distinto de la MZP, sino más bien un estado de activación acrecentada para aque- 
llos *'nodos de idea”” en la memoria que Corresponden a las categorías percibidas 
de la experiencia, Segundo, la teoría de Atkinson y Shiffrm se refiere en gran me- 
dida al control de las repeticiones verbales de estímulos lingitísticos o nombrables. 
Reconoce que los estímulos no verbalizables dejan huellas que se debilitan de la 
MCP, pero dice muy poco acerca de estas huellas. Tercero, los modelos MCP- 
MLP en gran parte resultaban algo vagos sobre lo que era exactamente la ““infor- 
mación”* que se transfería de la MCP a la MLP. No podría ser la palabra presen- 
tada ““perro””, por ejemplo, puesto que ya se conoce. Anderson y Bower (1973) 
sostienen que la información se concebía mejor como una proposición que esti- 
pulaba el contexto en el cual ocurría un reactivo familiar; por ejemplo, la palabra 
*'perro”' aparecía en la tercera posición de la segunda lista en este experimento. 
Las teorías MCP-MLP también eran poco precisas en lo que se refiere a la mane- 
ra en que la información que llega recientemente a la MCP se confronta primero 
con la almacenada en la MLP, a fin de evaluar lo que es antiguo, redundante y 
puede ignorarse, en comparación con lo que es nuevo, significativo y debe repetirse 
y aprenderse, 

Este cambio y selección entre los elementos de entrada para determinar lo 
que ya se conoce y lo que es nuevo parece requerir de mucha más interacción 
entre los dos almacenes de memoria, de lo que se prevé en las cajas separadas 
de la figura 13,4. 


NMueles de procesamiento 

Tal vez el reto más serio a la teoría de Atkinson-Shiffrin provenga de la estruc- 
tura de “niveles de procesamiento” propuesta por Craik y Lockhart (1972; Craik, 
1973). La idea básica es que la MCP o la MEP no son el resultado tanto del “*lu- 
gar'” en la mente donde se almacena un reactivo, sino más bien del tipo de pracesa- 
miento que recibe, Esto se diagrama en la figura 13.7. Craik y Lockhart postulan 
que el procesamiento perceptual de una palabra —perro, por ejemplo— puede con- 
cebirse como el avance por una serie de etapas, desde las características senso- 
riales superficiales del estímulo visual o auditivo, su pronunciación o sonido, hasta 
su significado semántico o asociativo. Proponían que para mantener el procesa- 
miento en un nivel exclusivo y prevenir el procesamiento en un nive! superior pue- 
de establecerse un proceso de control. Postulaban además que el procesamiento 
de una palabra en un nivel dado de ir detrás de una huella de memoria de ese tipo 
(sensorial, fonológica o semántica), y que la tasa de pérdida de una huella es más 
lenta cuanto más '“profunda'” o más semántica sea. Estas diferentes tasas de 
decaimiento para los tres distintos niveles de la memoria se muestran en la parte de- 
recha de la figura 13.7, 

Craik y Lockhart (1972) ofrecieron dos formas de comprobar este punto de vis- 
ta. Primero, en diversos experimentos de aprendizaje incidental se demostró que 
los sujetos muestran mejor recuerdo y memoria de reconocimiento para una pala- 
bra cuanto más “*profundo”” sea el nivel de procesamiento que se les exija aplicar a 
ella durante el ensayo de estudio, Así, hacer que el sujeto categorice una palabra 
semánticamente (¿es una flor>"”) produce un recuerdo demorado superior que 
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hacer que categorice sus propiedades visuales superficiales (““¿está impresa en le- 
tras mayúsculas?”') o sus propiedades fenológicas (**¿rima con banco?””), 

El segundo tipo de evidencia que citan Craik y Lockhart tiende a demostrar que 
la repetición de un reactivo per se no mejora la memoria del mismo, siempre que la 
reiteración continúe en la misma profundidad de procesamiento. Esto contradice 
directamente las premisas anteriores de que la repetición verbal por sí sola hace 
que la información se transfiera a la MLP. Craik y Lockhart distinguían dos for- 
mas, repetición de mantenimiento, que es el reciclaje superficial del material y no 
promueve la MLP, y repetición elaborada, que promueve la MEP al conectar el 
material que ha de aprenderse dentro de estructuras asociativas existentes en la 
memoria (mediante oraciones o imágenes). Conjeturaron que el tiempo de reite- 
ración en el experimento típico promueve la MLP sólo hasta el grado en que impli- 
que cada vez más repetición elaborativa. 

Craik (1973) revisó la evidencia de que las variaciones en la cantidad de repeti- 
ción de mantenimiento (*“sondeos superficiales”') no mejorarían la MLP para las 
palabras, Un experimento clásico de este tipo fue el realizado por Woodward, 
Bjork y Jongeward (1973), quienes presentaron palabras simples en el contexto 
de un experimento de olvido dirigido. Una palabra se presentaba brevemente y, 
después de un intervalo de 0 a 12 segundos, aparecía una marca verde o roja, que 
señalaba a los sujetos si debían recordar u olvidar la palabra que acababan de estu- 
diar. Éstos presumiblemente mantienen la palabra en un estado de repetición 
hasta que aparece la señal. Después de esa presentación de una breve lista, los 
sujetos recordarian libremente todas las palabras '*por recordar”' en ella. Luego 
de proporcionarles varias de esas listas, se pedía inesperadamente a los sujetos 
que hicieran un recuerdo libre de todas las palabras de todas las listas anteriores. 
Lo sorprendente de los resultados del estudio de Woodward es que las probabi- 
lidades de recuerdo libre de las palabras son constantes e independientes del tiem- 
po de demora (tiempo de repetición) antes de la señal para recordar u olvidar la 
palabra. Las palabras '*por recordar” se retenían mejor que las palabras “*por olv+ 
dar”, tal como se esperaba, pero el nivel de recuerdo en ambos casos no se afec- 
taba por el tiempo de mantenimiento simple durante el estudio de un reactivo, 
Este tipo de resultado (ningún efecto sobre el recuerda del reciclaje fonológico de 
una palabra) se ha encontrado reiteradas veces. Un contraste curioso en el estu- 
dio de Woodward y colaboradores es que la ejecución sí mejora como una función 
del intervalo de repetición cuando la memoria se comprueba por reconocimiento. 
Después de la prueba final de recuerdo libre, se presentaba a los sujetos una lista 
maestra de palabras y debían verificar aquellas que se habían presentado antes. 
En esta prueba su reconocimiento de un reactiva era mejor cuanto más largo fuera 
su intervalo de repetición de mantenimiento. Así, aunque la repetición de mante- 
nimiento no ayudaba al recuerdo libre de un reactivo, contribuía en algo a la MEP 
para apoyar el reconocimiento. Este contraste se ha repetido en varios experi- 
mentos. 

Una posible interpretación de dicho contraste la proporciona la teoría del 
recuerdo libre y la memoria de reconacimiento propuesta por Anderson y Bower 
(1972a). En esa teoría, la memoria de reconocimiento de un reactivo depende de 
que la persona establezca en la MLP una asociación entre el reactivo y la idea del 
contexto (lista) experimental en el cual éste se presentó. Por otra parte, el re- 
cuerdo libre de un conjunto de reactivos depende en alto grado de que el sujeto 
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encuentre o establezca asociaciones entre los que están en la lista, de modo que 
en el recuerdo la persona pueda asociar de un reactivo de lista al siguiente. En 
estos términos, la repetición de mantenimiento (reciclaje de una palabra sencilla 
en un contexto dado) fortalece la asociación entre palabra y contexto, pero no las 
asociaciones entre los reactivos de la lista. De hecho, las reiteraciones de un solo 
reactivo impiden que el sujeto piense acerca de conexiones interreactivo nece- 
sarias para el recuerdo libre. Por otros estudios sabemos que tal recuerdo se faci- 
lita considerablemente al instruir al sujeto para que relacione cada reactivo con 
todos lo que pueda en la lista, 


Críticas a Los niveles de procesamiento 

Los niveles de la estructura de procesamiento han sido motivo de crecientes 
ataques experimentales y teóricos (Baddeley, 1978; D. L. Nelson el al., 1979; T. 
O. Nelson, 1977). Primero, a la noción de la profundidad del procesamiento se le 
reprocha por ser excesivamente vaga y circular, ya que no existe una medición in- 
dependiente por medio de la cual ordenar diferentes tareas de procesamiento a lo 
largo del continuo de profundidad. Segundo, se ha demostrado que una tarea de 
orientación dada (por ejemplo: '*¿qué rima con esta palabra?””) no restringe la 
huella de memoria de ese reactivo a esa característica exclusiva. En este sentido, 
los pares de palabras que han de aprenderse por asociaciones imaginarias o 5e- 
mánticas interferirán de todas formas unos con otros si comparten primeras letras 
osonidos comunes (D, L, Nelson el al., 1979). Asimismo, las palabras codificadas 
individualmente por sonidos rítmicos se agruparán en el recuerdo libre mediante 
categorías semánticas; es decir, el sujeto recordará todas las palabras de la lista 
que se refieren a animales, después a comidas, luego a vehículos, etcétera. Ter- 
cero, se ha demostrado empíricamente que el procesamiento reiterado de un 
reactivo a la misma profundidad mejora su recuerdo libre si esas repeticiones se 
producen a intervalos espaciados (T. O. Nelson, 1977). Craik sostiene que la pre- 
sentación separada del mismo reactivo y de la tarea orientadora no es igual que la 
repetición de mantenimiento y, en consecuencia, que los resultados de T. O. 
Nelson no son relevantes, No obstante, el mejoramiento en la memoria de reco- 
nocimiento en el estudio de Woodward (1973) contradice directamente la idea de 
que la repetición de mantenimiento conduce a ningún aprendizaje. Cuarto, el que 
una tarea de orientación fonética o semántica prepare mejor o no al sujeto para una 
prueba posterior de memoria depende de lo que sea la prueba de memoria. Por 
ejemplo, si el sujeto debe estimar de memoria cuántas palabras en la lista rimaban 
con bolsa, pliemea, etc., será sensiblemente más exacto si codifica las palabras en 
términos de sus sonidos en lugar de hacerlo conforme a su significado. De modo 
que los niveles de ejecución dependen de si la pregunta en la prueba de memoria 
es compatible con los atributos de palabra seleccionados por la tarea de orienta- 
ción (Morris, Bransford y Franks, 1977). 

Otro serio problema es que dentro de cada uno de los niveles que identifican 
Craik y Lockhart (1972) puede diseñarse una enorme variedad de tareas de orien- 
tación, y la idea de los niveles por sí sola no ayuda a ordenar su efecto en la memo- 
ña. Este terna ha sido tratado en el nivel semántico por Johnson-Laird y sus aso- 
clados (1976), y por B. H. Ross (en prensa). En el estudio de Johnson-Laird los 
sujetos clasifican cada palabra en una lista con arreglo a si el referente tiene o no 
las tres propiedades de ser líquido, consumible y natural. Así, sidra y agua po- 
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seen esas tres propiedades, cerveza tiene dos, pastel una, y papel ninguna. El re- 
cuerdo libre posterior de una palabra aumentará cuanto mayor sea el número de 
propiedades que tenga. La teoría que propone Ross para estos y otros resultados 
similares es que cada pregunta semántica que el sujeto formula activamente acer- 
ca del reactivo proporciona otra ruta más de asociación y recuperación para su re- 
cuerdo ulterior. Ross también propone que una respuesta verdadera o falsa a una 
pregunta no debe importar. Además, durante la tarea de orientación, el sujeto 
pasa por las preguntas de propiedades en orden para cada palabra, y deja de pro- 
cesarlas tan pronto como llega a una decisión acerca de la pregunta global. Ross 
descubrió, como lo habían hecho Johnson-Laird, que cuando la decisión requerida 
era: '“3f, si todas las tres propiedades””, el recuerdo se incrernentaba cuanto ma- 
yor fuera el número de propiedades que tuviera la palabra. Además descubrió que 
si la decisión era: ''sí, si hay algura de las tres propiedades”, entonces el recuer- 
do resultaba más pobre mientras más propiedades tuviera la palabra. Supuesta- 
mente, para la decisión de alguna, cuanto más propiedades verdaderas posea 
una palabra, más rápidamente se detiene el proceso de interrogación yse lega auna 
decisión para esa palabra; por lo tanto, se establecen menos asociaciones para 
apoyar su recuerdo posterior. Por último, si el sujeto se ve obligado a indicar si 
cada propiedad es aplicable o no a la palabra, entonces su recuerdo ulterior es 
constante e independiente del número de propiedades positivas que tiene la pala- 
bra. Los resultados de Ross apoyan su hipótesis de que lo crucial en estos experi- 
mentos es el número fofal de decisiones, y no sólo el imero de decisiones verda- 
deras, Así, al parecer las preguntas activan asociaciones semánticas (por ejemplo, 
“el agua es natural”); y las diversas propiedades de la pregunta estarán disponi- 
bles más tarde en la memoria para indicarle al sujeto que recuerde las palabras de la 
bsta, donde más indicios promueven más recuerdo confiable. Pero en ninguna de 
estas teorizaciones resultaron útiles los niveles de la estructura del procesamiento. 
Éstas y otras críticas de los niveles de la estructura del procesamiento condw- 
jeron a su modificación y elaboración graduales a un punto donde se ha desinte- 
grado como una teoría coherente (véase el volumen de Cermak y Craik, 1978). 
Los hechos descubiertos dentro de la estructura de los niveles comienzan a expli- 
carse dentro del sistema de memoria dual mediante dos factores: 1. el grado de 
elaboración del material por ser recordado (donde la “profundidad” se traduce como 
*“'mucha elaboración semántica” del material); y 2. la correspondencia entre los 
atributos que se recalcan durante la codificación y aquellos que son útiles para res- 
ponder la prueba posterior de memoria. Éstos son principios familiares y se in- 
corporan con facilidad en los modelos de la memoria de dos almacenes. Glanzer 
(1978), por ejemplo, demostró que los resultados con los niveles de experimentos 
de procesamiento podían ubicarse dentro de una teoría de dos almacenes, como la 
de Atkinson y Shiffrin. Como sucede a menudo en psicología, las críticas y los re- 
tos de que es objeto una teoría dominante conducen a la postre a argumentos con- 
trarios, a perfeccionamientos y a la evolución de la misma teoría predominante. 


ORGANIZACIÓN Y MEMORIA 


En ocasión de revisar la teoría de la Gestalt en el capítulo 10, examinamos el pa- 
pel que sus proponentes asignan a la organización como un determinante de la me- 
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moría y del recuerdo. Se consignaron varios resultados acerca de la coherencia en 
la memoria de los elementos organizados juntos mediante varias condiciones de 
agrupamiento. El enfoque de la Gestalt postulaba que los agrupamientos percep- 
tuales o conceptuales del material se convertirían en las ““unidades psicológicas” * 
en la mesnoria y el recuerdo. 

Este tera 5e trató en un artículo muy importante de G. A. Miller (1956) en el 
cual sugirió, entre otras cosas, que la memoria reproductiva inmediata estaría li- 
mitada en términos del número de bloques de elementos en vez del número de 
elementos aislados, Así, una lista de 7 palabras de dos sñabas se recuerda tan bien 
como una lista de 7 palabras de una sílaba o de 7 letras aisladas, ya que a todas se 
les trata como unidades separadas. La unidad psicológica es aquella cantidad de 
material que la persona ya conoce (por ejemplo, una palabra o cliché). La conjetura 
era que el recuerdo inmediato se restringía a alrededor de 7 bloques, Ifite éste 
que constituye un promedio estadístico y no un número invariable, En esta pers- 
pectiva, una persona aprende una lista más larga (de 14 palabras na relacionadas) al 
organizar las unidades de orden inferior en 7 o menos unidades de orden superior. 
Por tanto, el aprendizaje había de considerarse como una cuestión de segregación, 
clasificación y agrupaniento de unidades elementales dentro de un número menor 
de bloques más ricos y más densamente clasificados. 

Esta hipótesis, junto con otras, motivó la investigación en el recuerdo libre y más 
tarde en los dispositivos mnémicos. En el recuerdo libre, como se ejemplifica en el 
experimento de Rundus que hemos revisado (véase la figura 13.6), el sujeto es 
expuesto a una lista de palabras e intenta recordar tantas de ellas como pueda, y 
en cualquier orden. Lo "'libre*” en el recuerdo libre es el orden en el cual la perso- 
na recuerda los reactivos del conjunto que ha de recordarse. Esa libertad nos per- 
mite atribuir cualquier estereotipia y patrón sistemáticos del recuerdo del sujeta a 
los procesos Organizativos que utiliza para aprender el material. Puede notarse 
que el recuerdo libre no se ajusta al paradigma estándar de estímulo-respuesta, 
ya que no hay un estímulo específico, sólo el precepto inútil del experimentador que 
indica recordar la lista de palabras que se acaba de presentar. 

A partir de artículos muy importantes de Bousfield (1953), Tulving (1962, 1966, 
1968) y G. Mandler (1967, 1968), el recuerdo libre se ha estudiado a fondo camo 
una situación de prueba tendiente a revetar procesos organizativos en la memoria. 
Un libro editado por Tulving y Donaldson (1972) revisa y evalúa muchas ramas en 
un gran árbol de investigación acerca de este tema. Las investigaciones del re- 
cuerdo libre han demostrado reiteradas veces que los sujetos agrupan siste máti- 
camente las palabras durante el recuerdo, a pesar de que éstas se presentaron 
muy separadas durante la entrada de la lista. Los agrupamientos del sujeto muy 
frecuentemente tienden a darse con base en la similitud de significado de las pala- 
bras; es decir, a partir de sus asociaciones sernánticas, Si la lista se compone de 
palabras de diversas categorías semánticas (por ejemplo, animales, ciudades, ve- 
getales, automóviles), los vocablos pertenecientes a una categoría dada serán 
especialmente propensos a agruparse juntos durante el recuerdo. Según esta hi- 
pótesis, el efecto de la práctica reiterada sobre una lista de palabras es aumentar 
el tamaño y la estabilidad de estos “grupos subjetivos'”. cada uno de los cuales 
constituye un conjunto integrado por diversas listas de palabras. Si al sujeto se le 
obliga a cambiar sus agrupamientos cada vez que estudie la lista (al hacer que 
forme imágenes mentales para representar cuartetos variables de los reactivos de 
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la bista), la mejoría en su recuerdo de esa lista se demora seriamente (Bower, 
1970»). Al parecer, el agrupamiento interreactivo de las palabras de la lista es ne- 
cesario y suficiente para promover el aprendizaje de recuerdo libre: la simple ex- 
posición a una lista de palabras sin instrucciones para aprender lo provoca muy 
poco (Tulving. 1966), mientras que el hacer que la persoua sólo clasifique los vo- 
cablos de la lista en categorías con base en las similitudes significativas promueve 
un recuerdo incidental posterior tan bueno como cuando se le indica que aprenda 
las palabras durante la clasificación (G. Mandler, 1967). Tales resultados sugieren 
que el aprendizaje se logra al organizar el material, 

Como hemos dicho, la hspótesis del bloque constante establece que el recuerdo 
inmediato promedio no puede exceder de un número constante de bloques (de 
cuatro a ocho; el número varía de un teórico a otro), Si la cantidad de bloques se 
hace muy grande, deberán agruparse a su vez en una jerarquía de unidades de or- 
den superior, En la figura 13.8 se muestra una hipotética jerarquía de unidades 
subjetivas. Las palabras de la lista se colocan en un índice desde W, hasta W,,. Los 
nodos marcados 3, son nombres, nodos o códigos internos en la memoria que sim- 
bolizan a los grupos de palabras dominantes en la jerarquía; el nodo A, representa 
una colección de nodos B,. Ésta es la presunta estructura de la memoria. 

El aspecto fundamental de tal jerarquía es que el nodo superior puede servir 
como el nombre que se tiene en la MCP para la estructura completa de la infor- 
mación en la MEP. Así, la lista N podría recuperarse al señalar al sujeto con la lista 
N (val hacer que se señale a sí mismo); este indicio puede entonces '“desempa- 
carse asociativamente*' en términos de los bloques A,, A,, y A.; el A; puede des- 
empacarse en términos del B, que entonces conduce a la generación de las pala- 
bras de la lista, Johnson (1970) proporciona el modelo y las pruebas más explícitas 
acerca de la forma en que una estructura jerárquica de la memoria podría recupe- 
rarse. Las pruebas de Johnson implican recuerdo sería! de las series de letras en 
bloques (agrupadas), pero su modelo general puede aplicarse al recuerdo libre 
desordenado. 


Figura 13.8. Jerar- 
quía ilustrativa de 
bloques de nivel 
superior, que abar- 
ca en grupos las 27 
palabras de la lis- 
ta con los índices 
W, Wa... Waz. 
8 indica grupos 
de palabras W; A, 
indica grupos de 
grupos B. El nodo 
superior, lista N, 
representa la lista 
completa en la 
memoria. 
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Una jerarquía es un poderoso plan de recuperación, ya que abarca con facilidad 
un cierto número de elementos (27 o 3 en la pequeña jerarquía que se muestra en 
la figura 13,8). Además, Bower y asociados (1969) demostraron que los sujetos 
en recuerdo libre se beneficiaban considerablemente por el hecho de tener sus lis- 
tas de palabras “preorganizadas'” de un modo jerárquico, que revelaba las jerar- 
quías semánticas asequibles en las listas de palabras construidas con cuidado. Los 
sujetos parecen usar el árbol jerárquico como plan de recuperación, comenzando 
en la parte superior hacia niveles sucesivos de manera repetitiva. Aunque estas 
son interesantes demostraciones del poder de las organizaciones jerárquicas en la 
memoria, de ningún modo prueban que eso sea lo que los sujetos hacer en verdad 
mientras aprenden listas de palabras supuestamente no relacionadas. En lo que 
concierne a ese tema, el jurado aún no ha dado su veredicto. Los modelos de 
simulación por computadora del recuerdo libre (J, R. Anderson, 1972; Bower, 
1972c) explícitamente no son jerárquicos en su carácter básico. Sin embargo, las 
fallas del modelo de Anderson parecen relacionadas con su falta de agrupamiento 
jerárquico. Para mayores detalles, pueden consultarse los artículos citados. 


Dispositivos mnémicos 


Con el creciente intéres por los factores organizativos en la memoria, era inevi- 
table que los psicólogos recurrieran al análisis de los dispositivos mnémicos. Los 
dispositivos mnémicos son aquellos que permiten a la persona enriquecer o elaborar 
el material por aprender, con el objetivo de ayudarla a recordarlo mejor. Gene- 
ralmente ayudan también a clasificar y a organizar el material. Hay diversos dispo- 
sitivos mnémicos, que varían de acuerdo con los tipos de materiales y los requisi- 
tos de recuerdo para los que son apropiados, algunos de los cuales se describen en 
varios textos: Furst, 1958; Lorayne y Lucas, 1974; M. N. Young y Gibson, 1966. 

Un dispositivo mnémico ampliamente analizado (Bower, 19705) es el método de 
L “palabra pretexto”? para aprender listas ordenadas de reactivos como las listas 
de la compra, recados, acontecimientos históricos, conjuntos de leyes psicológi- 
cas, etcétera. La técnica se ilustra de forma abreviada en la tabla 13.2. La per- 
sona aprende primero una lista de palabras pretexto rítmicas, pareando imágenes 
concretas con las primeras 20 unidades, aproximadamente. Ál aprender un nueva 
lista de reactivos, la persona emplea entonces palabras pretexto sucesivas, como 
“ganchos*” imaginarios para conectar los reactivos sucesivos de la lista. Cuando 
ocurre la primera palabra de la lista (cigarro), la persona ha de recordar su primera 
palabra pretexto, y formar una imagen mental de alguna escena vívida de interac- 
ción entre los dos objetos. Los ejemplos se presentan en la cotumna derecha de la 
tabla 13.2. Las imágenes pueden ser tan extravagantes como uno lo desee, 
puesto que su efectividad es independiente de su aspecto. Se sigue el mismo 
procedimiento de imaginar pares con cada uno de los vocablos de la lista. Para re- 
vivir la serie en la memoria, la persona sólo necesita repasar su ista ya bien apren- 
dida de palabras pretexto, y a medida que considera por turno a cada una, intentar 
recrear o recordar la escena imaginaria elaborada en torno de la imagen de la pala- 
bra pretexto. Á partir de esta escena recordada, por lo común podrá nombrar el 
reactivo deseado (cigarro). 

Éste y otros esquemas similares son sumamente efectivos, al menos en compa- 
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TABLA 13-2. lustración de las primeras cuatro imágenes de palabra pretexto 
y su empleo en el aprendizaje de los primeros cuatro 
reactivos de una lista de compra. 


Palabra pretexto Palabra de la lista imagen mnémica 
uno-Bruno cigarro Bruno fumando un cigarro 
dos-hoz mantequilla untar mantequilla en el filo de una hoz 
tres-res gallina una gallina montada en una res 
cuatro-teatro clavos poner clavos en la puerta principal 
de un teatro 


e 
. 
. 


ración con el recuerdo libre normal de los sujetos a los cuales no se les enseña nin- 
guna treta especial. El recuerdo podría mejorar por un factor de dos a tres veces 
más que lo normal. Una de las principales razones por las cuales el dispositivo ope- 
ra adecuadamente es que la persona tiene un esquema de recuperación sistemático; 
sabe cómo darse wn indicio a sí misma con los reactivos (las palabras pretexto) con 
los cuales ha asociado explícitamente los vocablos de la lista cuando se presen- 
taron. Por otra parte, el sujeto usual del recuerdo libre sencillamente no sabe 
cómo traer a su memoria todas las palabras de la lista que conoce. Sabemos que si 
al sujeto ordinario le damos varias pistas, especialmente indicios semánticos 
(“una de las palabras de la lista es un producto lácteo'”), recordará mucho más de 
lo que puede hacerlo por su cuenta (Tulving y Pearstone, 1966; Tulving y Psotka, 
1971. Por lo tanto, la ventaja para el usuario de las palabras pretexto es en parte 
el resultado de su conocimiento acerca de cómo darse indicios sistemáticamente 
para cada una de las palabras, a partir de cada posición de entrada-lista. La segun- 
da ventaja del método de la palabra pretexto proviene, sin duda, de su despliegue 
de imaginación mnémica. Como la imaginería mental se ha convertido en un tema de 
reciente interés en la investigación acerca de la memoria humana, a continuación 
examinaremos algunos de esos estudios. 


Imaginería mental 


La imaginería mental o “iJustraciones del ojo de la mente””, es uno de aquellos 
conceptos relativos a la introspección que John Watson y otros conductistas radi- 
cales consideraban inútiles en la psicología objetiva. Si bien no negaban las expe- 
riencias subjetivas que las personas describen como “*poseedoras de imágenes”, 
sostenían que la “conducta pública'* tenía que analizarse primero por derecho 
propio, en vez de considerarla sólo como un índice de su contraparte subjetiva, la 
cual, en el léxico conductista, era simplemente una carga excesiva. En cualquier 
caso, y por la razón que fuere, la memoria humana terminó por enfocarse a través 
de las lentes un tanto distorsionadas de los ““hábitos verbal-motores'' (Watson, 
19240; Hull et al., 1940). En su revisión clásica y monumental del campo del 
aprendizaje humano, McGeoch e [rion (1952) ni siquiera mencionan el tema de la 
imaginería, la imaginación o la visualización. 
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Evidentemente, la opinión ha cambiado, y en la actualidad la imaginería mental 
es un tema común de investigación. Este giro ha sido causado por la creciente 
aceptación de la perspectiva cognoscitivista en la investigación de la memoria, y el 
rechazo de una estricta visión conductista. Se han esgrimido argumentos sólidos y 
efectivos (Bower, 1972b; Cooper y Shepard, 1973; Paivio, 1971; Richardson, 
1969) para reconocer la imaginería mental (o el “sisterna imaginativo'?) como uno 
de los principales modos de representación de información en la memoria, y se 
han sugerido diversas características para distinguir el modo de representación 
imaginativa del verbal-simbólico. Por ejemplo, el sisterna imaginativo parece estar 
especializado para tratar con la información presentada simultáneamente, en para- 
lelu, de fuentes distribuidas en el espacio, mientras que el sistema verbal 
parecería el idóneo para tratar con la información presentada en secuencia, en 
serie, a partir de las fuentes distribuidas en el tiempo. En suma, el sistema de ima- 
ginación (en particular la imaginación visual) representa información distribuida en 
el espacio, mientras que el sistema verbal trata mejor con la información distri- 
buida en el tiempo. 

En los últimos tiempos se han realizado muchos experimentos de aprendizaje 
que indican que la representación imaginativa o gráfica de la información general- 
mente facilita la memoria, en un grado que oscila desde 1.5 a 3, más o menos, Por 
ejemplo, los estudiantes a quienes se les pide que elaboren imágenes mentales a 
En de aprender pares arbitrarios de palabras concretas, recuerdan alrededor de 
15 a 2 veces más de pares asociados que Jos sujetos de control que no recibieron 
esas instrucciones. En extensos estudios en los cuales se examinan varios atribu- 
tos de las palabras y Ja forma en que varía el aprendizaje que efectúa una persona 
de las palabras con esos atributos, Paivio (1971) y sus asociados descubrieron que 
el carácter concreto de la remisión de una palabra (0 la intensidad de imaginación 
que excita) es el predictor más poderoso de la calidad de memorable de esa pala- 
bra. Esta generalización se mantiene con exactitud en una variedad de tareas del 
aprendizaje verbal, aun cuando el valor de imaginación de las palabras se compare 
con otras mediciones, como el carácter significativo, el número de asociaciones, la 
familiaridad, emocionalidad, y clasificaciones semánticas-diferenciales. Además, 
los resultados estándar del aprendizaje verbal que históricamente se han atribuido 
a factores verbales, como el carácter significativo de la palabra, de hecho pueden 
deberse a un efecto de imaginación (véase Paivio, 1971, para los ejemplos), ya 
que ésta posee una muy alta correlación con el carácter significativo o el número 
de asnciaciones que provoca. 

¿Por qué las ilustraciones, después las imágenes, y por último las palabras con- 
cretas se recuerdan en ese orden, y por qué todas ellas se recuerdan mejor que 
hs palabras abstractas? La conjetura actual es la denominada hipótesis de la huella 
doble (Bower, 1972b; Paivio, 1971). Se supone que hay dos formas diferentes de 
representación, la imaginativa y la verbal, y que los conceptos dentro de esos sis- 
temas generalmente están muy conectados, de forma parecida a las palabras 
equivalentes en dos idiomas. Cuando-se muestra una palabra para ser recordada, 
el sujeto hace entrar una huella de memoria de ese evento en $u almacén verbal. 
Si se trata de una palabra concreta, se activan los nodos correspondientes 
(conceptos) en el sistema imaginativo, la persona **experimenta la imaginería co- 
rrespondiente”*, y en el sistema de imaginación se establece una huella del 
evento. De modo que una palabra (o par de palabras) que se imagina, o una ilustra- 
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ción que se nombra, tiene la ventaja de poseer dos copias redundantes de la 
huella de memoria establecida. En comparación con los reactivos abstractos, la re- 
dundancia prolonga la memoria, ya que se cree que la segunda huella imaginativa 
tiene probabilidades de sobrevivir después de que la huella inicial verbal se ha de- 
bilitado. Es decir, na sólo hay dos huellas, sino que la del sistema imaginativo 
parece más resistente a] olvido. 

Aunque ésta no es una hipótesis particularmente reveladora, ha dado lugar a 
muchas investigaciones (por ejemplo, Paivio, 1971; Paivio y Csapo, 1972). Taro- 
bién ha orientado un gran número de esfuerzos prácticos para usar la imaginación, 
las representaciones pictóricas y dispositivos audiovisuales especiales a fin de pro- 
mover el aprendizaje en las escuelas primarias Jensen y Rohwe, 1970; Rohwer, 
1970). Ahora parece razonablemente seguro que todos los esfuerzos en la instruc- 
ción audiovisual, además de enseñar al alumno técnicas de elaboración mnémica e 
imaginación de materiales para ser aprendidos, tienen probabilidades de elevar al 
máximo la cantidad de aprendizaje que puede obtenerse, en el menor tiempo y con 
el mínimo de repetición y dificultad, Sin embargo, todavía se desarrollan diversas 
teorizaciones e investigaciones para esclarecer aún más la relación entre la imagi- 
nación y el lenguaje, en particular el papel que la imaginería ha de desempeñar en 
las concepciones del significado semántico. 


DISTORSIONES EN LAS CONTINGENCIAS 
DEL APRENDIZAJE 


La doctrina de la asociación describe un mecanismo por medio del cual el orga- 
nismo detecta y aprende correlaciones entre los eyentos de su mundo. Se cree 
que la asociación entre A y B rastrea la frecuencia relativa del evento B a conti. 
nuación del evento A. Como tal, la fuerza asociativa es una medición de la pre- 
dictibilidad o expectancia de B a partir de A. En esta concepción, el aprendizaje 
asociativo proporciona los fundamentos para que los organismos se conviertan en 
'estadísticos intuitivos”? e induzcan de modo mecánico y con razonable exactitud 
las regularidades de los eventos en su mundo. 

Sin embargo, esta visión de los seres humanos como exactos estadísticos intui- 
tivos comienza a desmoronarse a medida que se señalan sus errores sistemáticos, 
prejuicios y desventajas, Algunas de estas fallas se han demostrado en las inves- 
tigaciones de Tversky y Kahneman (1971, 1973, 1978; Kahneman y Tversky, 
1971, 1973). Los que revisten interés para esa discusión son aquellos que 
muestran un fuerte impacto de las creencias previas del sujeto acerca de su ha- 
bilidad para aprender correlaciones de eventos que no confirman tales creencias, 
La evidencia muestra que si la persona comienza la serie de aprendizaje con una 
fuerte creencia de que dos eventos están correlacionados (aunque de modo imper- 
fecto), se requiere de una prueba contundente para convencerla de que no es así, 

Experimentos clásicos acerca de este tema son los de Chapman y Chapman 
(1967, 1969). Los Chapman querían saber por qué los psicólogos clínicos persis- 
tían en usar pruebas de personalidad como la de dibujar a una persona (DAP), 
cuando la investigación ya había demostrado que la prueba no era válida. Los psi- 
cólogos clínicos argumentaban que según su experiencia las pruebas resultaban 
bastante útiles, y que ciertas respuestas de los pacientes eran signos muy confia- 
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bles de que padecían enfermedades psiquiátricas. Por ejemplo, esos clínicos 
creían que cuando los pacientes dibujaban retratos de personas, aquellos con ten- 
dencias paranoides recalcarían o distorsionarían los ojos, mientras los que sufrían 
problemas de dependencia destacarían la boca o harían dibujos propios de niños; 
quienes tenfan tendencias homosexuales dibujarían hombres femeninos o figuras 
de sexo dudoso, etcétera. Éstas son correlaciones ilusorias, pues ya se ha demos- 
trado que la prueba DAP no es válida. 

Los Chapman sostienen que las correlaciones jlusorias surgen y persisten por 
dos razones: 1. las creencias sobre la covariación entre un signo del dibujo y una 
enfermedad psiquiátrica a menudo se basan en asociaciones semánticas o teorías 
del sentido común (par ejemplo, los ojos revelan desconfianza; dependencia sig- 
nifica tener un carácter infantil) en vez de fundarse en una observación exacta de 
eventos covariantes; y 2. tales creencias duran más que la experiencia real con los 
datos pertinentes, aun cuando aquella debería negarlas. Sus experimentos propor- 

cionan abundante confirmación a estas hipótesis. Primero, cuando se pregunta a 
los legos qué partes del cuerpo sugieren rótulos psiquiátricos como paranoia, de- 
pendencia, impotencia, casi siempre mencionan los mismos indicios que los médi- 
cos clínicos han “*visto”” como señales significativas en la prueba DAP. Segundo, a 
un grupo de estudiantes ingenuos se les mostraron 45 dibujos DAP realizados por 
enfermos mentales, que se pareaban aleatoriamente con seis diagnósticos psi- 
quiátricos mencionados con frecuencia (suspicacia, dependencia, etc); después de 
una cuidadosa lectura de los pares dibujo y diagnóstico, se les pidió que conjetu- 
raran qué caracteristicas de los dibujos DAP se habían asociado más a menudo con 
cada diagnóstico. Estas estimaciones de covariación efectuadas por los estudian- 
tes expuestos a una serie aleatoria eran virtualmente una copia fiel de las realiza- 
das por médicos clínicos experimentados; es decir, afirmaban que en la serje de 
dibujos la suspicacia se indicaba comúnmente por un dibujo que exageraba o distor- 
sionaba los ojos, y así por el estilo. Con las respuestas a las tarjetas Rorschach de 
las manchas de tinta y con la prueba DAP se obtuvieron resultados similares. Los 
Chapman postularon que las correlaciones ilusorias se debían a asociaciones 
semánticas que los estudiantes y los médicos clínicos compartían. En un sentido 
más general, podemos concluir que si las personas creen que dos eventos (como 
un signo DAP y un rasgo de personalidad) están correlacionados aunque sea de 
modo imperfecto, esa creencia es excesivamente persistente y difícil de debilitar. 
De hecho, la gente es propensa a emerger de la exposición a una evidencia en ex- 
tremo contraria, con una fe incluso más férrea. 

En otro experimento, los Chapman (1969) demostraron que si las señales se- 
mánticamente sobresalientes y populares (por ejemplo, anal-eróticas, genitales) 
fueran asequibles en una serie de tarjetas para utilizar en el diagnóstico 
psiquiátrico de la homosexualidad, los observadores ¡ ingenuos las seleccionarían y 
usarían, a pesar de que hubiese un signo diferente (ver ““monstruos”” en una de- 
terminada tarjeta Rorschach) que fuera un indicio perfectamente válido para el 
diagnóstico. En otras palabras: la falsa creencia en la validez de una relación parti- 
cular entre signo y diagnosis era tan poderosa que enmascaraba e impedía el 
aprendizaje de una correlación verdadera que estaba presente. 

Los resultados de los experimentos de los Chapman recuerdan a los del bloqueo 
y el sombreado en el condicionamiento pavloviano, para los cuales el modelo de 
Rescorla y Wagner era apropiado (véase capítulo 9). En ese arreglo, un estímulo 
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neutral 4 pareado consistentemente con un El no adquiere fuerza asociativa si 
siempre ha estado acompañado de un segundo estímulo B, que se ha aprendido 
antes como predictor del £7. Para explicar claramente la analogía con la situación 
de aprendizaje planteada por los Chapman, la creencia previa de que un signo dado 
(B) está relacionado con un diagnóstico psiquiátrico particular (el 4Z)) puede en- 
mascarar el aprendizaje de una correlación real entre otro signo (4) en el patrón 
y en el diagnóstico del paciente. En su formulación actual, la teoría de Rescorla y 
Wagner espera que la extinción del indicio preferido se produzca a medida que el 
sujeto es expuesto a una serie aleatoria de pares signo-signo, Está claro que la 
teoría necesita de algún mecanismo que explique la mayor resistencia a la extin- 
ción de las asociaciones establecidas bajo programas El probabilísticos. Una ca- 
racterística de la mayor parte de las creencias humanas es que las correlaciones 
entre signo y síntoma son imperfectas y, por lo tanto, cabe esperar algunas “fa- 
llas'”, Desde luego, esa misma regla de anticipación impide el descrédito de las 
creencias falsas. 


Persissencia de los estereotipos sociales 

Los resultados de los Chapman se han repetido en diversas situaciones y se ex- 
tendieron en varias direcciones, En una de esas ampliaciones, Hamilton y Ross 
(en prensa) demostraron que los estereotipos raciales acerca de los negros, mexi- 
cano-estadounidenses, asiáticos y caucásicos aparecen como recuerdos prejuicia- 
dos en una tarea análoga a la de estimación de frecuencia postulada por los Chap- 
man. Hamilton hizo que sus sujetos (estudiantes universitarios) leyeran una larga 
serie de pares de palabras correspondientes a raza y rasgos (por ejemplo, negro- 
tímido, asiático-voz suave, etc,) que en general eran de carácter totalmente alea- 
torio. Más tarde, cuando los sujetos estimaron la frecuencia de pares particulares, 
sobreestimaron aquellos que se ajustaban a estereotipos raciales culturales (los 
asiáticos son callados, los mexicano-estadounidenses, irascibles). La aparente tre- 
cuencia de un pareamiento raza-rasgo parecía estimarse a partir de la fuerza de su 
asociación en la memoria o, lo que es igual al generar implícitamente una muestra 
de rasgos a partir del concepto de esa raza existente en la memoria. Los rasgos ya 
asociados con el estereotipo tienen así un prejuicio inicial, Hamilton y Ross obser- 
varon la perniciosa influencia de este mecanismo en la persistencia de estereoti- 
pos injustos y carentes de validez (raciales, sexuales, religiosos o de cualquier 
otro tipo), Incluso con universitarios de segundo año '*de mentalidad liberal”* (y 
de todas las razas), a quienes Se expuso a pares de raza y rasgo verdaderamente 
aleatorios, los estereotipos raciales que conocían (pero intelectualmente rechaza- 
ban) ejercieron una influencia sutil e inconsciente en la medición de la memoria. 

Resultados como los anteriores ponen en duda la exactitud de la visión de los se- 
res humanos como “'intuitivos peritos en estadística””. Los resultados que mues- 
tran prejuicios se obtuvieron en condiciones de laboratorio óptimas para el apren- 
dizaje y propicias para refutar creencias. En el mundo real, intervienen diferencias 
que tal vez atenuarían más el impacto, sobre las creencias erróneas, de datos 
reprobatorios. En primer lugar, en la vida real los casos de eventos de signo para 
el diagnóstico (A para B) se dan esporádicamente y no se concentran dentro de 
una exposición de minutos. Segundo, en la vida real a menudo media un largo 
lapso entre un signo (4) y un diagnóstico posterior (B), de modo que la 
contigitidad raras veces opera. En tal caso, la memoria que la persona tiene del 
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signo A puede distorsionarse a fin de ser congruente con el diagnóstico esperado 
(B). Tercero —y más importante—, la codificación o interpretación de los signos 
mismos (A y B) a menudo son ambiguas, escurridizas, sometidas a presiones para 
que sean coherentes con las expectativas. Así, el que se juzgue a la boca que apa- 
rece en un dibujo como:verdaderamente exagerada, se sujeta a si se clasifica al pa- 
ciente como dependiente; si el hecho de que el niño le responda a su maestro 
cuando éste lo reprende se interpreta como ““agresivo'” o como que el peque- 
ño. está ''“afirmando sus derechos'' depende de si aquél es mexicano-estado- 
unidense o caucásico. Es decir, las teorías implícitas que poseen las personas 
hacen que perciban los datos ambiguos de una manera que confirme su teoría. 
Desde hace mucho tiempo los psicólogos cognoscitivistas han propuesto, han in- 
vestigado y explicado la forma en que las expectativas influyen en la clasificación 
perceptual. Así, si a partir de un signo (mexicano-estadounidense) el sujeto que 
percibe infiere agresión, ese concepto será activado en lugar de que lo haga uno al- 
ternativo (afirmación), y estará listo a “*disparar'” cuando el sujeto que percibe 
vea que el niño le habla demasiado alto a su maestro. La categoría que se dispara 
es aquella que el sujeto que percibe utiliza para clasificar, reaccionar ante el suce- 
so, y recordarlo. La expiicación es similar a la que ofrecen los psicólogos cognosci- 
tivistas acerca de la manera en que las personas usan el contexto para interpretar 
palabras (pork /kerate-CHOP) o ilustraciones ambiguas (véase la figura 10.2, de la 
copa y los perfiles), K 


Prejuicios de confirmación 

Junto a los factores mencionados —que disminuyen el impacto de la evidencia 
negativa— los psicólogos han descubierto otro prejuicio de confirmación que las 
personas comúnmente siguen para comprobar sus creencias. Cuando intentan 
probar una hipótesis particular (“'¿La mayoría de los irlandeses bebe demasia- 
siado?””), buscan predominantemente la evidencia positiva confirmatoria (al en- 
trar en las tabernas de Dublin), mientras que por lógica buscarían con más ahín- 
co evidencia falsificada (visitando fiestas de año nuevo en Estados Unidos o mo- 
nasterios en Irlanda). Estas tendencias se han observado reiteradas veces en los 
estudios de laboratorio, aun cuando a los científicos presuntamente lógicos se les 
dan varias tareas de comprobación de hipótesis (Mahoney, 1976). Al suponer que 
ls entrevistas para conseguir empleo son similares a las comprobaciones de hi- 
pótesis, Snyder y Cantor (1979) han demostrado la forma en que las ideas precon- 
cebidas que los entrevistadores tienen acerca del empleo que un candidato solicita 
(bibliotecario o vendedor de automóviles) influyen en las preguntas personales 
que formulan, y también sobre la información de rasgos, aleatoña o ambigua, que 
proporcionan en relación con el solicitante. Los entrevistadores formulaban pre- 
guntas que básicamente originarían información congruente con su estereotipo del 
candidato para el puesto (por ejemplo, callado o bullicioso), y recordaban en espe- 
dial la información del solicitante que se ajustara a su estereotipo del empleo. Éste es 
otro ejemplo de la operación de los prejuicios de confirmación. 

El prejuicio de confirmación, junto con la baja prominencia de sucesos críticos, la 
persistencia de las falsas creencias, y las interpretaciones de sucesos ambiguos 
inducidas por una teoría, presentan un cuadro desalentador de los seres humanos 
como verdaderos científicos o procesadores de información. Las limitaciones de 
las capacidades humanas de raciocinio, inducción y juicio parecen estar muy entre- 
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hzadas con la forma en que opera la memoria. Disponemos de un cierto número 
de hewrísticas o métodos prácticos que nos ayudan a aprender y a tornar decisio- 
nes acerca de nuestro medio ambiente, pero los métodos prácticos no son algorit- 
mos lógicos y tienen terribles deficiencias. La naturaleza, alcance e implicaciones 
de estas deficiencias son motivo de profundas investigaciones. En un volumen de 
Nisbett y Ross (1979) se revisa y se ofrece un resumen de gran parte de este tra- 
bajo, que es significativo para modificar las visiones tradicionales de la racionalidad 
humana. 


MEMORIA EPISÓDICA VERSUS MEMORIA SEMÁNTICA 


Como quizá comience a parecerle evidente al lector, los investigadores de la me- 
moria humana son propensos a proponer distinciones entre varios tipos de memo- 
ria: de corto plazo y de largo plazo, acústica y visual, imaginativa y verbal, y así 
por el estilo. Éstas son clasificaciones útiles para delimitar el campo de acción en 
el cual pueden ser verdaderas las generalizaciones empíricas; también son muy 
heurísticas, al sugerir nuevas preguntas para guiar la investigación, así como 
nuevas respuestas para interrogantes antiguas. Con mucha frecuencia tales dis- 
tinciones evolucionan gradualmente a partir de conjuntos de trabajos experimen- 
tales, cuando los investigadores comprenden que tratan con fenómenos de la me- 
moria, que en propiedades críticas difieren de aquellos atribuidos a otras memorias 
regulares. 

Tulving (1972) condensó y estipuló inicialmente la distinción ahora dominante en 
la investigación de la memoria; es decir, la que existe entre la memoria episódica 
y la memorja semántica: 


Consideremos a la memoria episódica y a la memoria semántica como dos sistemas de 
procesamiento de información que: 1. reciben información selectiva de los sistemas per- 
ceptuales o de otros sistemas cognoscitivos; 2. retienen varios aspectos de esta informa- 
ción, y 3). guiados por instrucciones, transmiten información específica retenida a otros 
sistemas, incluyendo aquellos responsables de traducirla a la conducta y al estado cons- 
ciente. Los dos sistemas difieren uno del otro en términos de: a) la naturaleza de la in- 
formación almacenada; )) referencia autobiográfica versus cognoscitiva; c) condiciones y 
consecuencias de la recuperación; y probablemente también en términos de ch) su 
vulnerabilidad a la interferencia que da lugar a la transformación y desaparición de infor- 
mación almacenada, y d) su dependencia mutua. Además, la investigación psicológica 
acerca de la memoria episódica difiere en diversos aspectos de la que se lleva a cabo en 
torno de la memoria semántica (1972, pág. 385). 


Así, la memoria episódica registra información acerca de sucesos fechados que 
poseen atributos sensoriales particulares y que siempre tienen referencia autobio- 
gráfica. Un ejemplo sería que yo recuerde haber oído un trueno hace muy poco, o 
que recuerde haber visto un oso en el parque Yellowstone durante el último vera- 
no, o que recuerde que la palabra alfombra aparecía junto al número 14 en la lista de 
pares que acabo de estudiar. Una especificación de la memoria sernántica es la si- 
guiente: 


La memoria semántica es la necesaria para el uso del lenguaje. Es un diccionario menta; 
de conocimientos organizados que una persona posee acerca de las palabras y otros sím: 
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bolos verbales, el significado y las referencias de los mismos; acerca de las relaciones 
entre ellos, y acerca de reglas, fórmulas y algoritmos para el manejo de estos símbolos, 
conceptos y relaciones. La memoria semántica no registra las propiedades perceptibles 
de las entradas, sino las referencias cognoscitivas de las señales de entrada. El sistema 
semántico permite la recuperación de información que no se almacenó directasnente en él, 
y la recuperación de información del sistema deja sus contenidos intactos, aunque cual- 
quier acto de este tipo constituye una entrada en la memoria episódica. Es probable que el 
sistema semántico sea mucho menos susceptible a la transformación involuntaria y a la 
pérdida de información que el sistema episódico. Por último, el sistema semántico puede 
ser muy independiente del sisterma episódico a registrar y mantener información, ya que 
una gran variedad de señales de entrada puede originar idénticas consecuencias de alma- 
cenamiento (Tulving, 1972, pág. 386). 


Usualmente los recuerdos semánticos se encuentran en la MLP, han perdido 
toda referencia o información autobiográfica relacionada con su modo o contexto 
de aprendizaje, y se diría que constituyen parte de nuestros conocimientos perma- 
sentes. Ejemplos de conocimiento semántico son relaciones verbales como *“Los 
leones son mamiferos'', ** Hombre significa varón kumano''; hechos como “Chi- 
cago se encuentra en filinois”*; leyes como **Un objeto físico no puede estar en 
dos lugares al mismo tiempo'': y reglas de inferencia como ““Si el objeto 4 está 
con el objeto B, y A está ubicado en el lugar C, entonces B también está ubicado 
en el lugar C”. 

No es necesario reflexionar mucho para observar que casi todas las investiga- 
ciones de laboratorio acerca de la memoria se han ocupado en gran parte de la me- 
moria episódica. Se expone al sujeto a una serie de eventos discretos (presenta- 
ciones de palabras o ilustraciones en una lista), y después se le somete a prueba 
a íin de conocer la exactitud de su reproducción o identificación de la serie. Muy a 
menudo el indicio para la reproducción se refiere al contexto espacio temporal de 
los sucesos que deben recordarse, como en. “Recuerde los nombres de las ilus- 
traciones que acaba de ver en la lista experimental”, Desde luego, al codificar o 
aprender los eventos la persona puede hacer uso de los conocimientos existentes 
en su almacén semántico, Por ejemplo, si en una lista de pares asociados el sujeto 
ve el par pelirrojo-pájaro, ésa es ya una relación preestablecida en su memoria se- 
mántica, En este caso, sólo necesita identificar esa relación antigua y conocida con 
la nueva información autobiográfica que se presentó en un contexto experimental 
particular. 

Aunque la distinción entre memoria episódica y semántica es ampliamente reco- 
nocida, su popularidad parece deberse más a su atractivo intuitivo que a la sólida 
evidencia de diferentes funciones o procesos de la memoría. Una vez que acep- 
tamos que la información en la memoria varía en su contenido y fuerza (premisas 
innocuas, sin duda alguna), no está claro que la distinción entre episódica y semánti- 
ca implique mucho más. En primer lugar, las teorías como las de J. R. Anderson y 
Bower (1973), J. R. Anderson (1976) o Norman y Rumelhart (1975) siempre 
registran la nueva información (episódica o de otro tipo) dentro de la memoria, 
vinculándola con la misma red semántica, posiblemente con un contexto de adqui- 
sición observado, De modo que en estas teorías explícitas no hay distinción 
cualitativa entre una memoria para un episodio versus una referida a una regla ge- 
neral, Segundo, entre las denominadas memorias episódica y semántica existen 
sustanciales interacciones, lo cual pone en tela de juicio la idea de que son alma- 
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cenes distintos e independientes. Por ejemplo, si formulo una pregunta semántica 
simple (''¿Está Cleveland en Ohio?*”), el lector responderá cada vez más rápido, 
lo cual sugiere que el episodio de preguntar altera la velocidad de acceso a la infor- 
mación semántica. Por otra parte, si yo le enseño muchos detalles nuevos acerca 
de un concepto familiar como Cleveland, al parecer el lector se torna un poco más 
lento para responder a una pregunta acerca de un hecho “semántico” anterior, 
que conocía (véase J. R. Anderson, 1976, capítulo 8). Aunque la distinción entre 
memoria semántica y episódica es atractiva, consideraciones como éstas plantean 
la duda de sies o no fundamenta) para los procesos básicos. 


Juicios de contexto, recencia y frecuencia 


Independientemente de que la distinción entre memoria semántica y episódica 
se considere fundamental, cualquier teoría de la memoria debe reconocer que los 
eventos de estímulo se registrarán en la memoria junto con alguna descripción del 
contexto en el cual tuvieron lugar, Este contexto no sólo contiene las característi- 
cas perceptuales de la modalidad fisica de presentación del reactivo, sino también 
aspectos incidentales como dónde y cuéndo se dijo o hizo, y por quién. Podemos 
concebir a estos elementos contextuales como características asociadas a la re- 
presentación interna del evento, que son potencialmente recuperables cuando se 
le pide a la persona que recuerde o reconozca tal evento (véase J. R, Anderson y 
Bower, 19724). Los experimentos han demostrado que los sujetos registran de 
modo automático todo tipo de información incidental; por ejemplo, recuerdan si 
una palabra se presentó de forma visual o auditiva, si fue pronunciada por una voz 
masculina o femenina, si se presentó oralmente o por medio de una ilustración, si 
apareció a la izquierda o a la derecha de la pantalla de exhibición, etc. (Light et al., 
1973). Tiene especial interés el hecho de que los sujetos también pueden juzgar 
cuán recientemente ocurrió un evento dado ex el tiempo. Como esos juicios de re- 
cencia obviamente implican el recuerdo, las principales teorías que se refieren a 
dichos juicios han tratado con la memoria (véanse Hinrichs, 1970; Ornstein, 1969). 
Un modelo que realiza una labor útil supone que la presentación de un reactivo es- 
tablece una asociación con un conjunto de elementos contextuales, y que la fuerza 
de tal presentación declina de modo sistemático en el transcurso del tiempo, a me- 
dida que se interpolan otros eventos. Cuando el reactivo vuelve a presentarse 
para comprobación, la persona evalúa la fuerza del reactivo en la memoria, y sobre 
esta base realiza un juicio de recencia de la experiencia para el mismo, Según esta 
teoría, cabe esperar que los reactivos que se presentan varias veces para fortale- 
cer su huella de memoria tenderán, en consecuencia, a juzgarse como si hubieran 
ocurrido más recientemente que los más débiles, presentados una vez. Este mo- 
delo tiene varias imperfecciones evidentes, y se han propuesto algunas medidas 
para rectificarlo (Flexser y Bower, 1974; Linton, 1975). La idea hásica es que el 
reactivo recupera un contexto asociado en el cual aparecía, y por un medio u otro 
la persona puede deducir, a partir de este contexto, cuánto tiempo hace que 
ocurrió. 

Otro tipo de información disponible en la memoria episódica es la frecuencia con 
la cual ha ocurrido un evento en un determinado contexto, o la frecuencia con la 
cual los eventos de una clase general o tipo han ocurrido. Un ejemplo del primer 
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tipo sería el juicio de que la palabra perro aparecía tres veces, dispersa en una lista 
de entrada; un ejemplo de lo segundo sería el juicio de que en la lista se 
mencionaban aproximadamente seis animales. Las personas son muy exactas en 
esta clase de juicios acerca de los recuerdos del evento, ya sea si saben o no du- 
rante el ensayo de estudio que tal información de frecuencia se someterá a prue- 
ba. La hipótesis dominante acerca de la forma en que se establecen los juicios de 
frecuencia en la memoria episódica es que Jos sujetos intentan recuperar y contar 
los diferentes contextos locales en los cuales ha aparecido el reactivo de prueba €, 
R. Anderson y Bower, 19724). Algo semejante a este proceso de recuento 
sucede con las frecuencias pequeñas (por ejemplo, seis o menos), pero para las 
frecuencias superiores se usa un procedimiento de '*recuperación-muestreo-más- 
estimación ”* (por ejemplo, comparar las frecuencias de ocurrencia de las gasoline- 
ras versus las tiendas de comestibles preparados, en Estados Unidos). 

Una de las aplicaciones significativas de esta técnica de recuperación de contex- 
to es la que se refiere al problema de decidir cómo ia repetición de un evento me- 
Jora su recuerdo. Básicamente, se han presentado dos propuestas alternativas. 
Una opinión es que una segunda ocurrencia hace contacto con —y fortalece— la 
huella de la aparición inicial del reactivo, y el recuerdo refleja esta fuerza acrecen- 
tada de la memoria. La otra es que la segunda presentación establece mayor infor- 
mación sobre el evento inicial, información que detalla el contexto de su ocurren- 
cia, El recuerdo mejora, entonces, porque la persona tiene más rutas de acceso a 
la información del evento, o porque la información se **copió múltiples veces” en 
conexión con varios indicios de recuperación. Un experimento de Hintzman y 
Block (1971) proporciona sólida evidencia para la última opinión. Los investiga- 
dores descubrieron que los sujetos podían recuperar información diferencial y ve- 
rídica acerca de Jas sucesivas repeticiones de un solo reactivo. Después de la pre- 
sentación de una lista de 100 reactivos, por ejemplo, los sujetos serían capaces de 
recordar con exactitud que la palabra perro aparecía dos veces, que su primera 
presentación era visual y que se encontraba en la quinta parte inicial de la lista de 
entrada, mientras que la segunda presentación era auditiva y figuraba en la tercera 
parte de la lista de entrada, Esa información discriminativa no podría obtenerse 
por medio de un mecanismo que tratara con la repetición sencillamente incremen- 
tando una “fuerza de hábito'” para la palabra ferro. Es interesante señalar que 
esta misma pregunta acerca de cómo trata la memoria con la repetición no podría 
haberse planteado con tanta claridad —ni siquiera responderse— dentro del mar- 
co de referencia del conductismo £-R, con su énfasis en los hábitos verbales. 
Esto ilustra el tipo de preguntas que hoy en día revisten interés para los teóricos 
de la memoria. 


Condiciones de codificación y recuperación 


Las actuales concepciones de la memoria han comenzado a reconocer el impor- 
tante papel que juegan los indicios de estímulo en ia recuperación de nuestros re- 
cuerdos de eventos. Los teóricos modernos empiezan a creer que un recuerdo es 
como un cofre cerrado que contiene un tesoro, y sólo requiere de la *'llave'* ade- 
cuada (o indicio de recuperación) para abrirse y revelar su contenido. Para extender 
más la analogía, la llave de la cerradura depende de lo que las personas pien- 
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sen acerca del evento cuando lo experimentan. Es decir, las operaciones de codi- 
ficación que se ejecutan sobre el reactivo determinan la situación de la cerradura. 
La analogía encierra una creencia general que estipulan Tulving y Thompson 
(1973, pág. 269): “Las operaciones especificas de codificación-ejecutadas sobre lo 
que se percibe determinan lo que se almacena, y lo que se almacena determina 
qué indicios de recuperación son efectivas para dar acceso a lo almacenado"'. 

La poderosa influencia de los indicios sobre el recuerdo se demostró en estudios 
iniciales de Tulving y Pearlstone (1966) y Tulving y Psotka (1971). Después de la 
exposición a una lista de palabras categorizadas (árboles, alimentos, ciudades, 
etc.), los sujetos eran incapaces de recordar muchas de ellas a no ser que se les 
dieran los nombres de las categorías como indicios, momento en el cual recorda- 
ban un gran número de palabras de la lista. La suposición es que los sujetos pensaban 
en estas categorías cuando estudiaban las palabras de la lista, lo que instigaba 
las asociaciones entre categoría e instancia; en consecuencia, el indicio de catego- 
ría activaba dichas asociaciones durante la prueba de recuerdo. 

Tulving y Thompson (1971, 1973) han intentado controlar la manera en que se 
codifica una palabra durante el estudio, al presentarla en el contexto de otra, Así, 
una palabra para ser recordada, como planchar, podría presentarse en el contexto 
de ropas. Tulving y Thompson suponen que la presentación del par ropas-planchar 
hace que planchar se codifique y se almacene de un modo específico; una condi- 
ción de prueba posterior recuperará esa memoria episódica sólo en el grado en 
que se superponga a la interpretación de planchar que estaba almacenada. A esto 
se le denomina principio de especificidad de la codificación (PEC). Por ejemplo, 
puede ser que la palabra blanchar (en inglés, fror, que también significa acero) ni 
siguiera se reconozca como perteneciente a la lista si se le comprueba por sí sola o 
en el par mineral-planchar (en inglés, ore-iron), pero sí se le identificaría en el 
contexto ropas-planchar (clothes-iron) o en vapor-planchar (steam-iron). Además, 
planchar (iron) se recordaría con el indicio de ropas o mesa de planchar, pero no 
con un indicio fuertemente normativo de asociación como metal o mineral. Un 
examen de estas diversas condiciones revela circunstancias en las cuales una pala- 
bra (planchar) puede recordarse con un indicio codificado (ropas), pero si se pre- 
senta sola quizá no se reconozca como perteneciente a la lista. Este resultado 
—que una palabra puede recordarse pero no reconocerse— parece paradójico hasta 
que comparamos las diferentes condiciones de recuperación en términos del PEC. 

Más allá del principio de la especificidad de codificación, la razón de que una pa- 
labra se recuerde frente a un indicio después de na haber sido reconocida, puede 
relacionarse con un principio de “'instigación”'. Instigación significa que la presen- 
tación de un vocablo incrementa su disponibilidad como respuesta a un estímulo 
relacionado. Así, si la presentación de la palabra planchar en la prueba de reco- 
nocimiento instiga su disponibilidad como respuesta, por este motivo cabría espe- 
rar algún recuerdo para su indicio ropas. Sin embargo, Bowyer y Humphreys 
(1979) descubrieron que los efectos de instigación no eran lo bastante grandes 
como para explicar toda la frecuencia de recuerdos a continuación de las fallas de 
reconocimiento. En este caso, parece que debe invocarse algo parecido al PEC. 


La interpretación semántica 
J. R. Anderson y Bower (1974) afirmaban que muchos de los resultados PEC po- 
dían interpretarse en términos de características o conceptos semánticos excita- 
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dos por distintos contextos en el estudio y en la comprobación, Así, en el contexto 
de ropas, la combinación de letras planchar excita el concepto de un objeto que 
se usa para planchar ropas, y no al del metal. Este concepto excitado es lo que se 
asocia en el contexto de la lista. Para que un reactivo posterior de prueba se reco- 
nozca, debe recuperar un concepto que se encuentre asociado con el contexto de 
la lista, 

Esta senda de recuperación puede fallar si el contexto de la prueba es mineral- 
planchar o sólo planchar, porque éstas pueden invocar una interpretación semán- 
tica diferente de la que tuvo lugar durante el estudio. Varios experimentos en los 
cuales el significado está explícitamente predispuesto de modo distinto durante el 
o y la comprobación, confirman estas predicciones (Light y Carter-Sobell, 
1970). 

Aunque la hipótesis de la interpretación semántica parece razonable, es un tanto 
forzada para tratar con resultados PEC que hacen uso de atributos de significado 
ligeramente distintos de una palabra, Así, el vocablo píaro se recupera mejor me- 
diante el indicio algo pesado después de haberse estudiado en la oración **El hom- 
bre levantó el piano””; por otra parte, se recupera mejor mediante aígo con un 
sonido agradable luego de haberse estudiado en la oración “El hombre afinó el pia- 
no”. 

Pero si el indicio de salida no se iguala con el contexto de entrada, el recuerdo 
por indicio es muy pobre (Barclay et al., 1974). En estos ejemplos, el significa- 
do de piano no cambia, aunque la propiedad que se activa difiere en ambos 
casos. Así, la hipótesis semántica debe generalizarse para tratar con haces de ca- 
racterísticas semánticas activadas en la entrada, y debe notar el grado en que los 
haces de características, excitados por los indicios de recuperación, se super- 
ponen a los de la entrada. Esa teoría puede producir explicaciones post hoc para re- 
sultados particulares, pero conduce a pocas predicciones que puedan llegar a 
sorprender. 

En la teoría de la interpretación semántica del PEC surgió un contratiempo dis- 
tinto cuando Watkins, Ho y Tulving (1976) descubrieron efectos significativos de 
contexto en la memoria de reconocimiento para ilustraciones de rostros. Les mos- 
traban a sus sujetos retratos de adultos en el contexto de una descripción verbal 
(por ejemplo, “este hombre trabaja para la maña”, “este hombre ama a los 
gatos”, etc.). Más tarde se les sometía a prueba para el reconocimiento de ros- 
tro sólo con la cara, el rostro y su descripción correcta, o el rostro con una des- 
cripción que en la lista de estudio se había pareado con una cara diferente. La me- 
morja de reconocimiento era superior cuando se comprobaba en la presencia de su 
descripción pareada original, e inferior con una descripción distinta. El resultado 
es similar a la experiencia común de no reconocer a una persona cuando se la en- 
cuentra inesperadamente en un lugar extraño. En este caso, el efecto no puede 
explicarse postulando diferentes significados del rostro, de acuerdo con las distin- 
tas descripciones. Sin embargo, es razonable suponer que el sujeto trata de en- 
contrar algunas características en el rostro que sugieran o justifiquen la descrip- 
ción (por ejemplo, los ojos siniestros del mafioso). De ser así, una descripción del 
rostro cambiada durante la prueba (por ejemplo, “*amante de los gatos'”) puede 
hacer que el sujeto tome diferentes características de la cara, con el resultado de 
un nivel inferior de memoria de reconocimiento. Esta interpretación está muy cer- 
ca de la que proporcionan Watkins, Ho y Tulving (1976). 
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Gestalt» de la memoria 

Una motivación que sustentó gran parte del trabajo acerca de la especificidad de 
la codificación era el deseo de demostrar que los patrones compuestos pueden te- 
ner propiedades Gestalt emergentes (““holistas””), y que los elementos constitu- 
tivos de esos patrones tal vez no sean reconocibles cuando se saquen de su con- 
texto. Un ejemplo común es que las personas pueden fallar al reconocer frases 
melódicas breves tocadas fuera de contexto, mientras son capaces de cantar la 
melodía completa. Watkins (1974) demostró un efecto similar con las palabras. A 
continuación del estudio de grupos de letras pareadas como SPANT-EL, EXPLO. 
RE y LIQUE-FY, los sujetos cometían muchos errores cuando se les pedía que 
reconocieran los grupos finales de letras (EL o RD, RE o DE, etc.); sin embargo, 
eran capaces de recordar a un nivel elevado las letras finales cuando se entrelaza- 
ban con los grupos iniciales (SPANT- y EXPLO-). Evidentemente, el almacenar la 
palabra completa en la memoria como bloque enmascaraba al grupo final de letras, 
de modo que de forma aislada no podía discriminarse de grupos no presentados. 

Estos ejemplos destacan el hecho de que el recuerdo con indicio de una parte de 
un todo puede exceder su reconocimiento cuando hay fuertes relaciones de la par- 
te con el todo, y cuando las partes son desiguales en la memoria de recuperación 
para el todo. Un problema es sí estos casos sen tan sólo exageraciones particu- 
lares o si señalan un fenómeno general; es decir, que la huella en la mernoria de 
cualquier reactivo se altera fundamentalmente al codificarse con su contexto como 
parte de un nuevo todo, El principio de especificidad de la codificación propone la 
segunda afirmación, que es muy congruente con la teoría de la Gestalt. Por otro 
lado, la teoría de J. R, Anderson y Bower (1974) intenta explicar resultados con 
base en las asociaciones de elementos constituyentes. Vale la pena notar la forma 
en que los temas de las antiguas intuiciones o tendencias elementalistas en contra- 
posición a las holistas siguen vibrando en todas estas controversias modernas a la 
manera de un estribillo. La perspectiva histórica ayuda al estudiante a identificar 
esos termas en la investigación actual y a utilizarlos como principios organizadores, 


MEMORIA SEMÁNTICA 


Como hemos dicho, la memoria semántica incluye nuestro conocimiento de los 
significados de las palabras, de nuestro lenguaje, de los procedimientos para hacer 
cosas (''recetas de acción””) y estrategias para resolver problemas; también abar- 
ca el conocimiento basado en hechos acerca del mundo, sus eventos, personajes, 
lugares y leyes individuales. El campo de acción es demasiado amplio para preten- 
der enumerarlo exhaustivamente. En la mayor parte de los estudios acerca de la 
memoria semántica, ciertas preguntas son de interés fundamental. Una se refiere 
a la manera en que se Organiza la información en la memoria, Un segundo proble- 
ma hace alusión a la forma en que la mente tiene acceso a información particular- 
mente pertinente, y la recupera en el transcurso de responder una pregunta. Otra 
cuestión es cómo la información ya conocida se usa para detectar redundancias en 
entradas recientes a fin de decidir qué es en verdad novedoso y debe registrarse 
en la memoria. Un problema también decisivo consiste en determinar de qué 
forma intentaríamos representar, en nuestras teorías psicológicas, la información 
que una persona tiene acerca de un domimio particular de conceptos. La decisión 


Cap.13. Desarrollos en las teorias cognoscitivistas 557 


acerca de cómo representar el conocimiento del sujeto tiene implicaciones rela- 
cionadas con su conducta para responder preguntas o efectuar inferencias, o eje- 
cutar acciones eficaces respecto a esa esfera de acción. 

Enla actualidad hay dos métodos primordiales para representar el conocimiento 
semántico, y ambos se ejemplifican en los programas de simulación por comptita- 
dora. Uno de ellos supone que la mayor parte del conocimiento puede represen- 
tarse como una estructura gráfica efiquetada, en la cual los puntos o nodos repre- 
sentan conceptos universales ('*perro”*) o individuos particulares (**Tobi””), y los 
eslabones entre nodos representan relaciones semánticas etiquetadas, entre con- 
ceptos o individuos, A continuación precisaremos un puco más esta noción, El se- 
gundo enfoque, que se presenta en gran parte en el programa de T. Winograd 
(1972) para la comprensión del lenguaje (véase capítulo 12), trata de caracterizar 
los conceptos en términos de reglas de inferencia (producciones) y rutinas de de- 
cisión (“Para decidir si X es un republicano, verifíquese previamente si posee las 
propiedades p, q, r, ...'"). El conocimiento por lo general se representa en térmi- 
nos de recetas de acción o procedimientos para provocar alguna consecuencia o 
tomar una decisión, Así, el enunciado universal *“Todos los hombres son mor- 
tales” se codificaría en términos de un programa pequeño que codifique un proce- 
dimiento; es decir, si quisiéramos averiguar si X es mortal, bastaría con probar 
que X es un ser humano. 

Los psicólogos se han inclinado más por las primeras representaciones, aquellas 
que emplean redes de relaciones semánticas etiquetadas, con la creencia de que las 
fórmulas de acción se “escriben” con facilidad a partir del conocimiento estático 
acerca de cuál es el caso y qué quiere lograr la persona. (De nueva cuenta, se de- 
tectan los ecos de los debates de Tolman y Guthrie acerca del conocimiento ver- 
sus la acción.) Las redes de relaciones etiguetadas entre conceptos semánticos en 
realidad no son tan diferentes de las nociones iniciales de los asociacionistas britá- 
nicos acerca de la forma en que las ideas complejas habían de integrarse mediante 
la asociación de ideas más simples, Lo que difiere en las explicaciones modernas 
es, en primer término, la noción de etiquetación de la asociación con el tipo lógico 
(o semántico) que ejemplifica; y segundo, la noción de que una idea compleja no 
necesita tener correspondencia directa con un estímulo o respuesta observables 
y, sin embargo, puede representarse como una unidad sencilla en la memoria, 
acerca de la cual es posible predecir más información. Nos hemos encontrado 
antes con esas ideas, en este capítulo y en el 6. Para una exposición detallada de 
estos aspectos filosóficos y sus ramificaciones en la psicología asociacionista, véa- 
seaJ. R. Anderson y Bower (1973, capítulos 2 y 4). 

Un enfoque elemental para representar conceptos y significados en términos de 
estructuras gráficas puede ¡lustrarse mediante un modelo de memoria semántica 
desarrollado por David Rumelhart, Peter Lindsay y Donald Norman, de la Univer- 
sidad de California, en San Diego (Rumelhart, Lindsay y Norman, 1972; Lindsay y 
Norman, 1972; Norman y Rumelhart, 1975). Primero, el modelo distingue entre 
conceptos y eventos. Un concepto corresponde en grandes rasgos a una idea; se 
introduce en el sistema mediante las definiciones que dan sus relaciones con otros 
conceptos en dicho sistema. Usualmente, mencionamos el tipo o la clase más 
general a la que pertenece el concepto, una o más de sus propiedades distintivas, 
y tal vez varios ejemplos o casos. Ásí, en la Águra 13.9 se muestra la información 
gráfica más simple que define el concepto de pájaro: es un tipo de animal, tiene 
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plumas, alas, y puede volar; ejemplos de pájaros son los petirrojos, los canarios, 
etcétera. El número de propiedades, de clase superior e inferior, puede exten- 
derse indefinidamente (véase Barsalou, en preparación). La gráfica elemental que 
aparece en la citada figura señala dos aspectos: que las relaciones son direccio- 
nales y que están etiquetadas. Por ejemplo, sabemos que la relación entre pájaro 
y animal es de clase subordinada (o ““subconjunto de””). 

Por supuesto, una memoria real contiene miles de tales conceptos, cada uno de 
ellos con muchas conexiones, de modo que la representación topográfica real se 
parecería a un enorme diagrama de instalación alámbrica. Pero una cantidad fan- 
tástica de información se codifica inherentemente en tales estructuras de gráfica. 
Para tener una idea, considérese el fragmento de una red semántica que rodea al con- 
cepto de taberna, como se muestra en la figura 13.10. Esta gráfica codifica implí- 
citamente la información de que una taberna es un tipo de establecimiento comer- 
cial (como una farmacia), que expende cerveza y vino, y Luigi's es un ejemplo 
de taberna. También proporciona algunas propiedades de la cerveza, del vino y de 
Luigi's, Desde luego, éste es sólo un fragmento, y en una memoria real podría 
existir mucha más información. Pero obsérvese la gran cantidad de preguntas que 
contestamos con ese solo fragmento. Por ejemplo, podemos responder preguntas 
que requieran cadenas de relaciones de subconjuntos, como ““Lwigi's es un esta- 
blecimiento””, o *“una farmacia es un lugar””. También se leen las propiedades o 
clases que dos conceptos cualesquiera tengan en común. Así, si le pedimos al sis- 
tema que compare las similitudes y diferencias existentes entre cerveza y vino, 
descubrirá con rapidez las semejanzas: ambos son bebidas que se venden en las 
tabernas, pero una está elaborada con granos fermentados y la otra con fruta fer- 
mentada, El número de relaciones objetivas que pueden derivarse y de posibles 
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preguntas que pueden responderse se incrementa de modo exponencial a medida 
que aumenta el número de predicados codificados o ''pizcas (bits) de cono- 
cimiento”. 

Los conceptos y sus definiciones en términos de clases, ejemplos y propiedades 
son útiles para muchos propósitos, pero todavía se necesitan más distinciones y 
reglas para desarrollar conceptos de segundo arden a partir de otros más elemen- 
tales. Rumelhart y sus asociados (1972) proporcionan un conjunto de tales reglas 
para formar conceptos de segundo orden, incluyendo reglas de calificación (borre- 
go > carnero joven), cuantificación (multitud > muchas personas), localización 
(bajo el agua; primeras horas de la tarde) y conjunción (jamón y huevos). Para co- 
dificar eventos completos utilizan la noción de proposición: el evento se basa en la 
acción, denota un escenario con agentes, acciones y objetos. Para representar 
tales eventos Rumelhart y sus asociados utilizan el caso de gramática, del lingilista 
Charles Fillmore (1968), como formalización de su estructura sintáctica profunda. 
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Figura 13.10. Fragmento de una red semántica que rodea al concepto de taberna. Las 
vínculos entre fos conceptos se etiquetan de acuerdo con su tipo (ramado de Lind- 
say y Norman, 19721. 
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Algunas de las principales distinciones en el caso de gramática se ilustran en la f- 
gura 13.11, que muestra la codificación propuesta del evento *'la policía que en au- 
tomóvil perseguía con rapidez a los asaltantes de un banco el día de ayer por Baker 
Street””. La acción gira en torno del verbo principal perseguir, que requiere de un 
agente (alguien que ejecute la acción), un objeto e, implícitamente, un medio o ins- 
trumento de la acción. El acto mismo puede modificarse mediante un adverbio de 
modo, como rápidamente, y la información de tiempo y de localización también 
puede vincularse con el evento. Las proposiciones lingtiísticas que escuchamos 
tendrían una codificación similar a la de los eventos reales. Por supuesto, la mayor 
parte de las proposiciones no complementan tantos detalles; son elípticas o limi- 
tadas de muchas maneras, debido a la referencia a partes anteriores de un diálogo 
o discurso en marcha, 


La codificación perceptual y el aprendizaje 


Hemos indicado el modo en que la información se registra en la memoria; es 
decir, en forma de proposiciones. Evidentemente, un requisito esencial para que 
esto suceda es que el sistema sensorio-perceptual cuente con rutinas para conver- 
tir las secuencias de estímulos configurados en proposiciones, al categorizarlos, 
interpretarlos y colocarlos en un marco de referencia ““declarativo””. La solución 
deseada se describe en la fgura 13,12, en la cual vna entrada pasa primero por el 
reconocimiento de patrón, y después se alimenta con ella a un analizador 
lingdístico o no lingiñístico (o ambas cosas), que extrae la(s) proposición(es) signi- 
ficativa(s) inherente(s) en la entrada. Las proposiciones perceptuales no son coex- 
tensivas con las etiquetas verbales, ya que se supone que los seres humanos no 
verbales tienen, sin embargo, proposiciones perceptuales. Un estímulo visual 
podría dar lugar a una proposición perceptual que se descríbiera con palabras coma 
éstas: **Un triángulo azul presentado sobre una tarjeta enfrente de mí””. Existen 
diversos programas en la inteligencia artificial (por ejemplo, Winston, 1970, 1977) 
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para convertir las escenas elementales de bloques en proposiciones. Aunque en la 
actualidad estos programas claramente tienen sólo capacidades burdas, la meta de 
su operación es convertir esoenas sensoriales en proposiciones significativas. El 
aprendizaje del lenguaje se concibe en parte como el sujeto que aprende corres- 
pondencias entre palabras y referencias perceptuales, y entre series semánticas 
de palabras y proposiciones perceptuales (véase J, R. Anderson, 1976). 

El analizador gramatical del lenguaje que aparece en la figura 13.12 es la parte 
del proceso que más se ha elaborado en la inteligencia artificial y en la psicolingilís- 
tica (véanse J. R, Anderson, 1976; Marcus, 1979; Norman y Rumelhart, 1975; 
Schank, 19754; "'. Winogsad, 197%). Se han probado varios métodos para identi- 
ficar ralces y terminaciones de palabras, a fin de analizar oraciones de entrada en 
cuanto a sus cláusulas y elementos gramaticales, identificar conceptos operativos 
y sus relaciones, y decidir cuáles son las proposiciones lógicas y atómicas expre- 
sadas en la superficie de la oración. El análisis gramatical por computadora del len- 
guaje natural se ha convertido en una ciencia avanzada por derecho propio. Baste 
decir que la salida del analizador gramatical será una o más proposiciones expresa- 
das, por ejemplo, como argumentos conceptuales de gramática de caso de un Con- 
cepto de acción, como la proposición perseguir que se muestra en la figura 13.11. 

En esa teoría, el *'aprendizaje”” consiste sólo en registrar el hecho pertinente 
en la red conceptual. Así, para el aprendizaje de una nueva proposición, “John 
es un ladrón”, se trata simplemente de establecer una asociación etiquetada “es 
un” (o **subconjunto de””) a partir de mi concepto preexistente de John, con mi 
concepto de ladrón. Si yo no tuviera un concepto pata John, entonces establecería 
un nuevo nodo en la memoria para representar este concepto nuevo con el cual 
puede vincularse más información. 

En tanto sea posible, las estructuras de inforutación nueva, como las que se 
muestran en la figura 13,11, se consideran **“fijadas dentro” de los conceptos ya 
conocidos de la memoria (como policía, Baker Street, etc.); la nueva información, 
0 mevo suceso proposicional es sencillamente un nuevo conjunto de conexiones 
temporales y etiquetadas entre estos conceptos preexistentes. Una vez que se 
codifique y aprenda una proposición, la persona puede emplearla para responder a 
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Figura 13.12. Componentes en la traducción de un evento de estimulo en una repre- 
sentación proposicional interna, El analizador lingúistico analiza el habla o la escri- 
tura, mientras el analizador perceptual analiza los estimulos no verbales 
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varias preguntas. Las preguntas generalmente especifican parte de la información 
deseada, y dejan en blanco los elementos que la respuesta ha de llenar. Preguntas 
como: **¿Qué sucedió ayer en Baker Street?””, o *'¿Cómo, cuándo y dónde per- 
siguió la policía a los asaltantes del banco?'” son algo así como indicios compuestos 
de recuperación, mediante los cuales comprobamos el sistema para la información 
deseada. La mayor parte de los sistemas de recuperación operan bajo un principio 
de “igualación de patrón”? o similitud. La pregunta se descompone primero en su 
formato de gramática de caso con algunas ranuras vacías (con signos de interro- 
gación), y entonces se busca la estructura de memoria con la mejor igualación que 
pueda encontrarse para el examen probatorio. Los eslabones particulares entre con- 
ceptos en la memoria sólo se recuperarán y usarán cuando las relaciones entre 
los conceptos sean las mismas que en las preguntas de sondeo. Así, al contestar 
preguntas acerca de a quién perseguía la policía el día de ayer, el sistema pasa por 
alto los hechos relacionados con la policía y la persecución que no sucedieron ayer, 
y también descarta instancias recuperadas donde la policía podría haber sido el ob- 
jeto en vez del agente de la acción de persecución (por ejemplo, ““ayer escaparon 
leones salvajes y persiguieron a la policía por Baker Street'”). Si la información pro- 
posiciona original se ha registrado ('“aprendida””) adecuadamente, si la pregunta 
probatoria estipula suficientes indicios de recuperación, y si la búsqueda de la me- 
moria procede con la rapidez y la eficiencia necesarias, el modelo de simulación 
debe dar la respuesta correcta. En la actualidad, el sisterna que más se ha aplicado y 
comprobado en cuanto a su plausibilidad psicológica a este respecto es el de J. 
R. Anderson (1976); sin embargo, nos alejaríamos mucho del tema si intentára- 
mos dar detalles de su teoría y del alcance de la evidencia que utiliza para solven- 
tar su credibilidad científica, 

Es necesario mencionar algo más. Primero, se entiende que en tales sisternas 
de representación las proposiciones completas, una vez codificadas, pueden tra- 
tarse como unidades por derecho propio, de modo que es posible hacer predica- 
ciones o comentarios acerca de ellas. Por ejemplo, el sistema puede registrar que 
“john deplora que tal cosa sea verdad”, “que tal cosa sea falsa”, o que “algo 
sucediera msey e hiempo'”. Asimismo, las proposiciones entran en conjunciones 
proposicionales, mediante el uso de conexiones como y, entonces, mientras y carsas. 
Así, una secuencia de sucesos, como la que contiene una historia, se registraría en 
la memoria como una cadena de eventos proposicionales de la forma general: 
““evento 1, entonces (evento 2 mientras evento 3) causa evento 4, entonces el 
evento 5,..”” 

La segunda cuestión atañe al problema de la inferencia y la deduccion al respon- 
der preguntas. Muy a menudo en el discurso se nos formulan preguntas para las 
cuales no tenemos respuestas directamente almacenadas; más bien debemos in- 
terpretar la pregunta e intentar inferir la respuesta a partir de otros elementos 
que conocemos. Así, podemos responder la pregunta: “¿Aristóteles tenía híga- 
do?””, al recuperar los hechos pertinentes de que Aristóteles era un ser humano, 
y todos los seres humanos tienen hígado, y aplicar entonces la regla lógica de que 
una propiedad verdadera para la clase es verdadera para cada miembro de la mis- 
ma. De modo similar, si se nos pregunta si alguna región de Chile es fría, podría- 
mos recuperar el hecho de que la cordillera de los Andes corre a lo largo de Chile, 
y que tas cumbres de esas montañas son frías; de modo que a pesar de que Chile 
se encuentra cerca del Ecuador, probablemente tendrá algunas regiones muy 
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frías. En esta última ilustración, la inferencia comienza a parecerse más a la ““sohu- 
ción de problemas”, donde debe recuperarse un número de hechos diferentes y 
evaluar su combinación para arribar a una respuesta. (Para una discusión más de- 
tallada de la contestación de preguntas, véase el capítulo 12). Aunque cada uno de 
nosotros ha desarrollado un repertorio variado y complejo para resolver tales pro- 
blemas de inferencia, los psicólogos todavía no dominan la forma en que debe es- 
cribirse un programa para simular estos procedimientos. 


Búsqueda en la memoria 


En la década de 1970 los psicólogos dirigieron muchas investigaciones para 
estudiar el tiempo que insume responder preguntas elementales como “¿Un ca- 
nero es un tipo de pájaro?” o **¿Un pelirrojo tiene piel?”*. La mayoría de los estu- 
diantes universitarios conocen relaciones de subconjunto entre dominios limitados 
de animales, y es probable que el sujeto responda algunas preguntas acerca de 
conceptos remotos al usar cadenas de relaciones de subconjunto. Es decir, la per- 
sona infería que un salmón es un animal, no porque conozca exactamente esa pro- 
posición sino porque combina dos hechos: el salmón es un pez y los peces son ani- 
males, En la figura 13.13 se muestra una jerarquía de conceptos y propiedades de 
los animales, donde las flechas verticales indican asociaciones de subconjunto. Se 
supone que las preguntas que implican inferencias que requieren combinación de 
hechos o eslabones de subconjunto necesitan más tiempo para ser contestadas 
que las interrogantes que impliquen simplemente el acceso a un hecho sencillo (un 
eslabón sencillo en la figura 13.13), Se esperaba que el estudio de los tiempos de 
contestación de preguntas revelaría la organización de la infinidad de hechos en la 
MLP de los sujetos, y el proceso mediante el cual los hechos seleccionados se re- 
cuperaban para responder preguntas. Por consiguiente, las organizaciones conje- 
tuwradas como la que se muestra en la figuea 13.13 podrían asegurarse con datos 
acerca de los tiempos de contestación de preguntas. 

En la actualidad generalmente se admite que después de un comienzo prome- 
tedor, este programa de investigación de la contestación de preguntas semánticas 
tropezó con problermas insalvables y a la postre llegó a un punto muerto. Ahora se 
cree que las familias o dominios conceptuales no se organizan de forma ordenada, 
lógica y económica, con propiedades almacenadas solamente en el nivel más gene- 
ral de la jerarquía a que corresponden (como se ilustra en la figura 13.13); más 
bien, dependiendo de las experiencias de aprendizaje de una persona, las propie- 
dades pueden almacenarse y tener referencias recíprocas en diversos niveles y 
fuerzas, El mejor predictor del tiempo de reacción de la gente para verificar una 
declaración verdadera “de subconjunto”” o una declaración de **propiedad””, es 
sólo la frecuencia normativa con la que ese concepto o propiedad se da como aso- 
ciado forzoso para e) concepto que tiene un sujeto, por parte de una población de 
sujetos similares (Glass et aí., 1974). La frecuencia de producción es únicamente 
una medición de la fuerza asociativa, un concepto que está incorporado en la ma- 
yor parte de los modelos actuales de la búsqueda de memoria (J. R. Anderson, 
1976; Collins y Loftus, 1975). Sin embargo, este enfoque no permite prácticamen- 
te ninguna predicción nueva, más allá de la correlación general entre la frecuencia 
asociativa de sujeto y predicado, y los tiempos verdaderos de reacción. 
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Figura 13.13. Ilustración de una jerarquía de tres niveles de conceptos de animales 
(puntos), con propiedades asociadas en conceptos específicos. Las flechas que seña- 
lan hacia arriba son asociaciones de sebconjunto y significan que el concepto 
inferior en la base de la flecha es un subconjunto del concepto superior en la punta 
de esa flecha (tomada de Collins y Quillian, 1969). 


Las teorías difieren en los procesos de búsqueda que proponen. En la actuali- 
dad, las más populares sostienen que para verificar la validez de una declaración 
como: “Un canario respira”, los dos conceptos se activan en la memoria, y tal 
activación se difunde ciegamente como una corriente eléctrica desde cada fuente, 
a lo largo de cada una de las sendas asociativas que parten de ellas. Todos los 
nodos que reciben activación sencillamente la pasan de uno a otro, y la difunden 
entre sus sendas externas. El procesador busca una intersección de las dos ondas 
de activación en algún nodo (por ejemplo, tal vez en el nodo denominado PÁJARO 
en la figura 13.13). Una intersección representa algún tipo de conexión entre el 
sujeto (canario) y el predicado (respira), y por eso debe evaluarse a fin de esta- 
blecer si la serie de eslabones de conexión es de la clase correcta que se necesita 
para responder la pregunta. Esta verificación de senda es indispensable para des- 
cartar conexiones espurias. Por ejemplo, canano y es gracioso también se inter- 
secarían en el nodo PAJARO en la figura 13.13, pero no queremos que el sistema 
diga automáticamente *“verdadera”” frente a tales intersecciones. 

Una implicación de ese modelo es que las declaraciones falsas en las cuales el 
sujeto y el predicado poseen muchas propiedades comunes o conexiones espurias 
(por ejemplo, **Un canario es un petirrajo””), tardarán más tiempo en rechazarse 
que los conceptos no relacionados, ya que antes deben examinarse de cerca varias 
intersecciones espurias. El hecho de que las oraciones estrechamente asociadas 
de sujeto y predicado se rechacen con lentitud se considera como evidencia para la 
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teoría de la propagación de la activación de la contestación de preguntas. Sin em- 
bargo, otros modelos —que presuponen que las preguntas se responden al exa- 
minar la superposición de propiedades semánticas excitadas por los conceptos de 
sujeto y de predicado— también pueden explicar este efecto (para una revisión, 
véase Smith, 1976). Ha resultado difícil diseñar pruebas definitivas de las diversas 
teorías rivales de la organización de la búsqueda y de la organización de la memoria 
semántica, empleando el conocimiento general de los sujetos. Tal vez una mejor 
estrategia es la que siguieron J. R. Anderson y Bower (1973) y J. R, Anderson 
(1976). Enseñaban a los sujetos hechos novedosos interrelacionados de una ma- 
nera específica, y comprobahan sus tiempos de contestación de pregunta para in- 
ferencias de una longitud conocida en la red asociativa, Esas redes construidas 
experimentalmente parecen producir respuestas más claras que los materiales 
semánticos naturales que contienen mucha variación idiosincrásica y poseen, bási- 
camente, una organización desconocida e incontrolada. 


Aprendizaje del texto y del discurso 


Hemos visto que las teorías de la memoria semántica, coro el modelo ACT de 
TR, Anderson, intentan describir el aprendizaje de enunciados simples o aseve- 
raciones objetivas. Así, una aseveración simple como *“John era infeliz'* supues- 
tamente es estudiada por el analizador de lenguaje de una persona, y se registra 
en su memoria al establecer eslabones asociativos entre los conceptos preexisten- 
tes de John y de infeliz. Se presume que la unidad básica del pensamiento es la 
construcción sujeto-predicado (S-P), la cual suele interpretarse en el sentido de 
que el concepto sujeto es un subconjunto o miembro del conjunto de cosas que el 
predicado describe. Así, “Fido mordió a John” significa que Fido es un miembro 
del conjunto de **mordedores de Jo". Las proposiciones complejas se repre- 
sentan en el ACT sólo como configuraciones más complicadas de construcciones 
sujeto-predicado, 

Conforme las teorías semánticas han comenzada a describir con éxito la mane- 
rá en que las oraciones no relacionadas se registran y se recuperan de la memoria 
(como do ha intentado Anderson con el ACT), los psicólogos se han abucado al es- 
tudio de fenómenos más complejos, como la forma en que las personas aprenden y 
recuerdan secuencias coherentes de oraciones o de textos. 

Desde hace mucho tiempo se ha despertado un gran interés en la psicología ex- 
perimental por la memoria de textos significativos, pero aún no fructifican los es- 
fuerzos tendientes a hacer de ella un tema de relevancia científica. Los estudios 
clásicos, por ejemplo, fueron dirigidos por Bartlett (1932), quien describió las dis- 
torsiones que hacían los sujetos en la reconstrucción de una leyenda indígena un 
tanto anómala, '“La guerra de los fantasmas'”. Bartlett puso en duda Ja tradición 
de la sílaba sin sentido de Ebbinghaus, que duminaba en su época (y hasta la dé- 
cada de 1960), y señaló inquietantes distorsiones interpretativas que tenían lugar 
en la memoria reconstructiva. Así, por ejemplo, observá que durante el recuerdo 
algunos de sus sujetos regularizaban partes extrañas o no convencionales de la 
historia, reinterpretaban los motivos de los personajes de acuerda con los 
estereotipos accidentales, se concentraban en (y elaborarían) algún detalle sor- 
prendente, etcétera. Aunque el libro de Bartlett y sus observaciones fueron muy 
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leídos y citados, los psicólogos que trabajaban en el aprendizaje verbal no dispo- 
nían en aquella época de las herramientas analíticas necesarias para tratar con la 
memoria que una persona tiene de un texto. Creían que la comprensión y la me- 
moría de un texto presentaban formidables dificultades y, por lo mismo, los consi- 
deraron como una cuestión cuya resolución se dejaba al futuro. Lo que sin lugar a 
dudas es un problema elemental para cualquier teoría de la memoria humana 
—cómo aprende la gente por el discurso— se pospuso esencialmente durante va- 
rias décadas. 

Los trabajos posteriores en los que se relaciona la teoría del aprendizaje asocia- 
tivo con la psicolingúística (J. R. Anderson y Bower, 1973; Kintsch, 1974) han 
vuelto a investigar el problema central del aprendizaje a partir de un texto, y enlos 
últimos años se ha incrementado considerablemente el interés en desarrollar teo- 
rías de la comprensión y la memoria de texto. Científicos de muchas disciplinas 
(psicología, educación, lingúística y ciencia de la computación) han hecho impor- 
tantes contribuciones. Han aparecido varias obras dedicadas a la memoria de texto 
(Freedle, 1979; Just y Carpenter, 1977; Kintsch, 1974; Meyer, 1975; Schank y 
Abelson, 1977), así como artículos en revistas tales como Discourse Processes, 
Cognitive Science y Journal of Educational Psychology. Asimismo, se construyeron 
varios modelos teóricos para describir la forma en que la gente entiende y recuer- 
da diferentes tipos de textos y narraciones (Kintsch y van Dijk, 1979; Thorndike, 
1978). 

Un texto es una secuencia de oraciones. Sin embargo, los textos tienen una co- 
herencia y una estructura que los hace ser mucho más que una secuencia arbitra- 
ria, Una de las continuas labores de los científicos en este campo consiste en des- 
cribir la estructura u organización del buen texto, y señalan qué lo hace coherente. 
Una útil hipótesis de Kintsch (1974), elaborada por Kintsch y van Dijk (1979), es- 
tablece que una condición necesaria para la coherencia (aunque no suficiente) es 
que las sucesivas oraciones compartan las mismas ideas (conceptos o refe- 
rencias). Es decir, las proposiciones de un texto congruente están interconecta- 
das; con frecuencia se refieren a las mismas cosas O ideas, e introducen otras nue- 
vas Sólo de modo gradual. Así, la coherencia de los textos puede analizarse de 
acuerdo con sus patrones de repetición de concepto. En la figura 13.14 se pre- 
senta un ejemplo de este tipo de análisis. El texto que se muestra es una oración 
larga, compuesta por ocho proposiciones, que aparecen en notaciones de predica- 
do-argumento a la izquierda de la tabla 13.2, (Una oración contiene a menudo dos 
o más proposiciones o relaciones básicas.) Así, la primera proposición enuncia que 
se forma turbulencia; la segunda, que esta formación está localizada en un borde; 
la tercera, que el borde es parte de un ala, y así, sucesivamente. El diagrama 
de la derecha en la tabla 13.2 vincula estas proposiciones que comparten una idea co- 
mún. Por ejemplo, la proposición 4 está conectada con la 1 mediante la idea 
común de ““turbulencia””; la proposición 8 se vincula con la 7 mediante la idea de 
““avión””. Las conexiones entre todas las ideas compartidas dan lugar a la 
estructura gráfica que aparece a la derecha en la tabla 13.2. Este procedimiento 
puede ampliarse para textos de cualquier longitud, y la estructura gráfica resultan- 
te se vuelve muy compleja, 

Supongamos que las primeras proposiciones de un párrafo contienen su tema 
principal. De ser así, la posterior mención de estos conceptos temáticos se subor- 
dina a su mención anterior, De este modo, es posible trazar una grátca de co- 


Proposiciones: Conexlones y niveles: 


1 (se farma, turbulencia) (2) (5) 
2 (localizada: en, 1, borde) 


3 (parte de, ala, borde) 

4 (crece, turbulencia, fuerza) E) (4) (5) (6) 
5 (localización: sobre, 4, superficie) 

6 (parte de, ala, superficie) 

7 (contribuye, turbulencia, levantar, avión) 


8 (supersónico, avión) (7) (8) 


Texto 


La turbutencla se forme en el borde de un ale y crece en fuerze sobre sy superficie, lo cual contribuye e 
leyentar a un avión sopersónico. 


Figura 13.14. Base de texto de muestra y texto (tomada de Kintsch, 1975) 
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nexión con la proposición del tema principal (primero) en la parte superior, y las 
otras proposiciones que se ramifican hacia abajo como un conjunto de calificacio- 
nes, modificaciones o detalles subordinados. Entonces se define el nivel de una 
proposición y su distancia en la gráfica de conexión desde la proposición del tema 
principal. Por ejemplo, en la gráfica de la tabla 13.2, si colocamos la proposición 
1 en el nivel 1, las proposiciones 2, 4, 7 estarán en el nivel 2, las proposiciones 3, 5, 
8 en el nivel 3, y la proposición 6 en el nivel 4. 

El nivel de una proposición en un texto predice si el lector la juzgará importan- 
te, y también si se recordará. De acuerdo con esta predicción, Kintsch (1974, 
1975) ha descubierto que la probabilidad que tiene el sujeto de recordar la esencia 
(significado) de una proposición disminuye cuanto mayor sea la distancia lógica 
que la separa de la proposición central. El efecto se nuestra en la figura 13.15, que 
presenta una gráfica del recuerdo de esencia, por parte de estudiantes universi- 
tarios, de diferentes párrafos de 70 palabras extraídos de artículos de Scientific 
American. Las dependencias de recuerdo entre proposiciones también parecían se- 
guir la gráfica de conexión; así, una proposición detallada (por ejemplo, en el nivel 
4) raras veces se recuerda sin ir acompañada de la proposición de nivel superior 
(nivel 3) vinculada con ella. Además, se sabe que el pensar en la proposición en 
un nivel ““instiga'' el estado de preparación del sujeto para recuperar de la memo- 
ña proposiciones directamente conectadas con ella en la estructura gráfica, Por lo 
tanto, el nivel de una proposición en la gráfica de conexión es un determinante 
principal de su recuerdo. 

Esta variable de nivel también parece predecir los juicios del sujeto acerca de la 
importancia relativa de las proposiciones para el “significado global”” del párrafo 
(Bower, 1976). Predice además la probabilidad de que la proposición aparezca 
cuando se le pida al lector que condense o escriba un resumen del párrafo com- 
pleto. 
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La gráfica de conexión funciona razonablemente bien porque se correlaciona con 
la organización temática usual de los párrafos. Así, si un estudiante resume un tex- 
to, como se le enseñó en la escuela primaria, en temas centrales, subtemas, sub- 
metas con detalles, ese diagrama organizativo es similar a los niveles en la gráfica 
de conexión, formados de acuerdo con la hipótesis de los conceptos compartidos. 
Para concepciones alternativas de la estructura del texto, véanse Meyer (1975) y 
Thorndike (1978), 

Xintsch y van Dijk (1979) propusieron un modelo más general para la memoria 
de textos que supone un mecanismo que explica por qué las proposiciones de nivel 
superior se recuerdan mejor (véase la figura 13.15). Como resultado, las proposi- 
ciones que son centrales en el texto y que contienen conceptos que se mencionan 
con frecuencia se mantienen activas, más tiempo en la MCP del lector. Así, a 
estas proposiciones se les asigna tiempo extra de repetición y aprendizaje, y por 
esa razón se vuelven sumamente memorables. Kintsch y Vipond (1978) ampliaron 
esta hipótesis para predecir la “dificultad de comprensión” ' o “interés” de textos 
particulares. Manteniendo constante la familiaridad de las palabras, emplearon di- 
ferentes textos que introducían nuevas ideas por proposición a tasas variantes. 
Descubrieron que la dificultad clasificada de un texto y el tiempo que los sujetos 
necesitaban para leerlo y para comprenderlo se incrementaba directamente con la 
tasa promedio de introducción de ideas nuevas. El modelo de lectura de Kintsch y 
Vipond es un exacta formulación de un principio que los instructores de lectura 
conocen desde hace mucho tiempo; es decir, que el materia) ''redundante' o “de 
ritmo lento'* es más fácil de leer y de recordar. Este resultado también se deduce 
del ACT de Anderson o de modelos similares del aprendizaje, ya que mientras 
más ideas compartidas haya entre proposiciones sucesivas, deben formarse 
menos eslabones asociativos nuevos a fin de registrar la información del texto en la 
memoria, 

Kintsch y van Dijk (1979) reconocieron que en el procesamiento de un texto el 
sujeto que lee o escucha hace mucho más que observar si las proposiciones suce- 
sivas comparten ideas. El lector también abstrae la esencia global del texto de una 
forma muy parecida a un boceto. Kintsch y van Dijk admiten que la hipótesis de los 
conceptos compartidos no basta para una comprensión total de las relaciones 
coherentes dentro de los textos. Por ejemplo, una secuencia de oraciones puede 
enumerar diferentes predicados acerca del mismo concepto, pero el texto parecería 
incongruente si los predicados no se relacionan o son contradictorios. Un segundo 
problema es que dos oraciones pueden estar estrechamente relacionadas y ser 
coherentes, pero no compartir ningún concepto. Por ejemplo, “John fue al restau- 
rante. El filete era magnífico. La mesera recibió una buena propina”? es una se- 
cuencia razonable, pero no hay conceptos que se repitan explícitamente. Los 
lectores comprenden la secuencia porque pueden ¿xferir las partes suprimidas 
usando su conocimiento del argumento del restaurante. (Esta idea del argumento 
se examinó en el capítulo 12), De este modo, el argumento permite efectuar infe- 
rencias acerca de las ideas compartidas entre estas oraciones elípticas: fue John 
quien comió el filete y dio una propina a la mesera que se lo trajo, y así sucesiva- 
mente. 

Uno de los principales problemas de la investigación consiste en especificar 
cómo emplean los lectores su conocimiento de la situación de que trata un texto 
para hacer inferencias plausibles; la computación de estas inferencias es necesaria 
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para llenar los vacíos literales en una descripción textual de la situación. Éste es 
un problema que la teoría del esquema (Thorndike, 1978) y la teoría de los argu- 
mentos, planes y metas de Schank y Abelson (1977) atacan conjuntamente dentro 
de los restringidos dominios del conocimiento. El espacio nos impide revisar aquí 
estos trabajos, pero recomendamos consultar las referencias citadas a fin de exa- 
minar algunas reseñas (véase también a Bower, 1976, 1978c). La investigación 
acerca de la comprensión y la memoria de texto se ha convertido en un punto cen- 
tral de interés teórico y experimental en la psicología cognoscitivista, Cabe espe- 
rar que contribuya a nuestra comprensión del aprendizaje humano de material 
complejo. También habrá de colaborar con la enseñanza en situaciones educativas. 


El futuro de los modelos globales de 
la memoria de largo plazo 


En una panorámica general no es posible proporcionar la razón fundamental 
completa, la evidencia y la motivación que sustentan al trabajo con los modelos del 
procesamiento de información semántica y la memoria de texto. Para una exposi- 
ción más completa y detallada deberán consultarse las obras de J. R. Anderson y 
Bower (1973), Kintsch (1974), Norman y Rumelhart (1975), o J. R. Anderson 
(1976). Sin embargo, es necesario apuntar algunas consideraciones acerca de la 
significación de estas teorías. En primer lugar, se trata de teorías que por vez pri- 
mera llevan la investigación del aprendizaje a un contacto bastante directo y fruc- 
tífero con la investigación en lingúística y psicolingilística. Siempre ha parecido que 
cualquier reconstrucción plausible de la memoria humana debe ser capaz de pun- 
tualizar algunas observaciones acerca de la forma en que el lenguaje se usa para 
aprender y recordar proposiciones, episodios, narraciones, representaciones de 
teatro, materiales basados en hechos, y cosas por el estilo. Pero la teoría E-R y la 
tradición del aprendizaje verbal no han tendido puentes sólidos desde su base de 
laboratorio hasta el problema de la comprensión del lenguaje (las críticas persua- 
sivas y devastadoras de aquellas antiguas explicaciones que lanzaron el lingiista 
Noam Chomsky y sus colaboradores se examinaron en el capítulo 7). La psicolin- 
gilística, como movimiento intelectual, en gran parte se desarrolló gracias a las 
críticas de Chomsky y a sus sistemáticos discernimientos acerca del lenguaje. 
Aunque la psicolingñística es un área de investigación muy fecunda de cierto modo 
ha permanecido alejada de las investigaciones más tradicionales de la memoria hu- 
mana (para reseñas, véanse Clark y Clark, 1978; G. A. Miller y McNeill, 1969; 
Slobin, 1971). Las nuevas teorías de la memoria semántica, que hemos reseñado a 
grandes rasgos, proporcionan un terreno común de contacto y de interés mutuo 
entre la psicolingiística, la inteligencia artificial y la psicología experimental de la 
memoria. Esto se ejemplifica en las obras de Anderson y Bower (1973) y de Anderson 
(1976), que revisan y combinan investigaciones en estas diversas áreas. Proponen 
una teoría de un sistema operacional de la cognición (realizado como un programa 
de simulación por computadora) que ejecuta un análisis lingñístico de la oración 
que se da al sistema; proporciona un medio para buscar lo que ya se conoce acerca 
de la información de nuevo ingreso, a fin de decidir qué partes de los recuerdos 
antiguos pueden volver a usarse para registrar la nueva información; ofrece una 
descripción matemática del proceso, mediante el cual se adquieren las nue- 
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vas estructuras de información, como la de la figura 13.11; y describe y cor» 
prueba experimentalmente un plausible mecanismo de recuperación por medio 
del cual una pregunta o un sondeo de recuperación obtiene acceso a la informa- 
ción que es relevante para construir una respuesta. Prácticamente toda la eviden- 
cia experimental que citan Anderson y Bower en favor de su modelo proviene de 
estudios realizados por elos mismos y por otros investigadores acerca de la me- 
moria para materiales proposicionales, sobre errores de confusión en la memoria 
de reconocimiento de oración, en torno a las dificultades que experimentan las 
personas para comprender y verificar oraciones al compararlas con ilustraciones o 
hechos conocidos, y acerca de las distorsiones de la memoria para materiales tex- 
tuales temáticamente relacionados. Sin embargo, también se esfuerzan en demos- 
trar la forma en que su teoría procede de la tradición asociacionista en psicología, 
cómo operaría la teoría en las tareas estándar de aprendizaje verbal, y de qué 
modo abarca los resultados estándar que apoyan a la teoría de interferencia de la 
transferencia y el olvido, La importancia del trabajo de Anderson y Bower reside 
en su intento detallado y serio de reunir dos áreas de investigación y dos tradicio- 
nes (memoria asociativa y psicolingiística), y de evaluar sus respectivas con- 
tribuciones a la comprensión de la memoria humana. 

El trabajo teórico acerca de los modelos de la memoria de largo plazo todavía se 
encuentra en la etapa formativa y de búsqueda (para reseñas, véanse J]. R. Ander- 
son, 1976, Freja, 1972). Sin duda, el área tendrá un formidable avance durante las 
próximas décadas, y las modestas teorías que ahora se ofrecen de modo pro- 
visional muy pronto quedarán atrás. Sin embargo, el nuevo trabajo es importante 
porque finalmente representa el “regreso a casa” del psicóloga pródigo a los pro- 
blemas complicados, pero fascinantes, de comprender cómo utiliza la mente hu- 
mana sus conocimientos lingúísticos y sus habilidades intelectuales en el apren- 
dizaje y en el recuerdo. Tales problemas no pueden evitarse indefinidamente, la 
promesa de los recientes modelos de la memoria semántica y la contestación de 
preguntas es que a) menos nos conducen de nuevo a estas sendas, para formular 
las interrogantes significativas y fundamentales. El camino es arduo y el progreso 
difícil pero tenemos la seguridad de que estamos estudiando procesos fundamen- 
tales del intelecto. El desarrollo de modelos de ejecución para la comprensión y la 
memoña del lenguaje, y el uso de los mismos, constituye un gran problema para 
la psicología cognoscitivista en los años venideros. 


TEORÍA DEL APRENDIZAJE SOCIAL 


Un libro como éste, que reseña diferentes enfoques teóricos, dehe dar la impre- 
sión de que el escenario de la ciencia contemporánea está seriamente fragmentado 
en una infinidad de campos de batalla, todos los cuales compiten por la suprema- 
cía. Pero esa impresión es terriblemente equivocada; de hecho, nada podría estar 
más lejos de la verdad. Aunque existe desacuerdo dentro de cualquier grupo de 
científicos, entre los teóricos del aprendizaje las discrepancias por lo común no se 
refieren a los resultados básicos o a los principios fundamentales, sino más bien a 
la interpretación que ha de darse a ciertos hechos. Dentro del escenario contem- 
poráneo en la teoría del aprendizaje, los desacuerdos no se suscitan alrededor de 
aspectos primordiales, a excepción de la gran división que todavía persiste entre 
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los conductistas skinnerianos y los psicólogos cognoscitivistas. Estos dos enfo- 
ques implican orientaciones metodológicas muy distintas, diferentes compromisos 
acerca del objeto de estudio de la psicología, y diversas restricciones referidas a 
qué tipos de teorías son admisibles. Esta distinción se examinó en ocasión de 
reseñar la posición de Skinner (capítulo 7) y al evaluar el movimiento de la modi- 
ficación de la conducta dentro de la psicología clínica y educativa que ha derivado 
su ímpetu de los conceptos del condicionamiento operante. Es posible que el lec- 
tor haya tenido la impresión de que la psicología cognoscitivista moderna (P. H, 
Lindsay y Norman, 1972; Neisser, 1967) sólo trata con la memoria humana y los 
procesos perceptuales, y soslaya otros factores, como la motivación, la recon 
pensa y la administración contingente de la conducta. Pero eso es falso. La teoría 
del aprendizaje social, una posición sistemática propuesta por Bandura (1969, 
19712, 19715, 19774; Bandura y Walters, 1963) y muchos otros (Mischel, 1968; 
N. E. Miller y Dollar, 1941; Rotter, 1954; Staats, 1968, 1975), intenta proporcio- 
nar una síntesis más equilibrada de la psicología cognoscitivista con los principios 
de la modificación de la conducta. Es una destilación selectiva de lo que tal vez sea 
una posición **de consenso'? moderada acerca de muchos problemas de impor- 
tancia para cualquier teoría del aprendizaje y modificación de la conducta. La teoría 
del aprendizaje socíal no trata sólo con el conjunto usual de principios del apren- 
dizaje, sino que agrega otros nuevos e intenta describir en detalle la manera en 
que un conjunto de competencias sociales y personales (la denominada personali- 
dad) podría desarrollarse a partir de las condiciones sociales dentro de las cuales 
ocurre este importante aprendizaje. También trata de modo muy explícito con las 
técnicas de evaluación de la personalidad (Mischel, 1968) y de modificación de la 
conducta en situaciones clínicas y educativas (Bandura, 1969; Krumboltz y Thore- 
sen, 1969, Watson y Tharp, 1977). 

Aunque el teórico del aprendizaje social acepta los preceptos usuales del conduc- 
tista en contra de la invocación de “causas internas'* psicodinámicas de la con- 
ducta desequilibrada, los atempera con un énfasis opuesto sobre el papel del fun- 
cionamiento cognoscitivo simbólico en la adquisición de nuevas conductas, y en la 
regularización de la frecuencia y las ocasiones de aparición de las mismas. 


Una crítica válida de las posiciones conductistas extremas es que en un vigoroso esfuer- 
20 por evitar causas intemas espurias, descuidan determinantes de la conducta humana 
que surgen de su funcionamiento cognoscitivo. El hombre es un organismo pensante que 
posee capacidades que le confieren algún poder de autodirección, El grado en que las teo- 
rías conductuales tradicionales sean erróneas obedece a que proporcionan una explicación 
incompleta —más que inexacta— de la conducta humana. La teoría del aprendizaje social 
insiste especialmente en los importantes papeles que desempeñan los procesos vicarios, 
simbólicos y autorreguladores (Bandura, 1971a, pág. 2). 


Como sabemos, las teorías tradicionales del aprendizaje han recalcado el apren- 
dizaje por la experiencia directa, mediante la aplicación de contingencias de refor- 
zamiento a las respuestas practicadas. Esto se condensa en las nociones de 
*aprendizaje por acción”, de diferenciación de la respuesta, y del moldeamiento 
de cadenas conductuales complejas mediante la aproximación sucesiva. La teoría 
del aprendizaje social acepta esos principios del moldeamiento, aunque tiende 
(casi como Tolman) a concebir el papel de las recompensas en este proceso en el 
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sentido de que transmiten información acerca de la respuesta óptima en la situa- 
ción, y proporcionan también motivación de incentivo para un acto dado debido a 
la recompensa anticipada, En contraste con el énfasis en el aprendizaje por acción, la 
teoría del aprendizaje social sostiene que gran parte del aprendizaje humano se 
realiza de modo vicario, al vbservar a otra persona que ejecuta respuestas habi- 
lidosas (leer acerca de ellas o ver ilustraciones de las mismas), y tratar entonces 
de imitar la respuesta del modelo, Con estos medios, el observador a menudo 
puede aprender y poco después ejecutar nuevas respuestas sin haberlas hecho an- 
teriormente o sin que hayan sido reforzadas (ya que nunca habían aparecido). Es 
obvio que muchas habilidades humanas (por ejemplo, la pronunciación de palabras 
extranjeras) de ningún modo podrían adquirirse sin este aprendizaje por observa- 
ción, y que varias otras habilidades, corno conducir automóviles —que podría 
aprenderse laboriosamente (aunque con peligro) sólo mediante sucesivas aproxi- 
maciones reforzadas— en la práctica se enseñan de modo más eficiente a partir de 
instrucciones verbales y demostraciones realizadas por una persona modelo, Aun- 
que estas técnicas de enseñanza se emplean de manera rutinaria y son familiares 
para todos nosotros, el lector debe comprender cuánto discrepan de los paradig- 
mas de entrenamiento recomendados por el uso exclusivo de procedimientos de 
reforzamiento operante. 


Aprendizaje por observación 


En una interesante serie de artículos y libros de investigación, Bandura (1962, 
1965, 1969, 1971a, 19716, 19774) ha señalado la ubicuidad y eficiencia de tal 
aprendizaje por observación en los seres humanos, y ha destacado sus caracterís- 
ticas únicas, que no se encuentran en los paradigmas estándares del moldeamien- 
to y el condicionamiento instrumental. Bandura también ha realizado una admi- 
rable serie de estudios, en especial con niños pequeños, que arroja luz sobre las 
variables que influyen en ese aprendizaje por observación. 

En el experimento típico, un niño de guardería (el sujeto) se sienta y mira a Otra 
persona (el modelo) que ejecuta una serle conductual particular. Más tarde se so- 
mete a prueba al sujeto en condiciones especificadas para determinar hasta qué 
grado imita su conducta. Ésta se compara con la de sujetos de control, que no nan 
observado el modelo. En esta situación pueden variarse un cierto número de fac- 
tores, y se ha demostrado que muchos de ellos afectan el alcance de la conducta 
imitativa que el sujeto ejecuta. A continuación se enumeran algunos de los facto- 
res estudiados por Bandura: 


a) Propiedades de estímulo del modelo 

1. La edad, sexo y estatus del modelo en relación con los del sujeto, que se 
hacen variar, Los modelos de estatus superior son los más imitados, 

2, La similitud del modelo con el sujeto: el modelo puede ser otro niño en la 
misma habitación, un niño en una película, un personaje animal en una cari- 
catura animada, etcétera. La imitación inducida en el sujeto disminuye a 
medida que el modelo se diferencia cada vez más de una persona real. 

b) Tipo de conducta ejemplificada por el modelo 
1. Las nuevas habilidades se comparan con las secuencias nuevas de respues- 
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tas conocidas. Mientras más complejas sean las habilidades, más pobre será 
el grado de imitación después de un ensayo de observación. 
. Respuestas hostiles o agresivas. Éstas se imitan en alto grado. 
. Estándares de autorrecompensa por buenas ejecuciones en contraposición 
a las malas. El sujeto adoptará estándares de autorrecompensa similares a 
los del modelo. Asimismo, imitará el tipo de estándares morales que exhiba 
un modelo adulto. Las técnicas de autocontrol pueden transmitirse de este 
modo. 
e) Consecuencias de la conducta del modelo 
1. Se varía el hecho de si la conducta del modelo se recompensa, castiga o “'ig- 
nora” (ni reforzada ni castigada) por otros agentes en el drama. Las 
conductas recompensadas del modelo son las que más tienden a imitarse. 
ch) Disposición motivacional que se brinda al sujeto 
1. Instnicciones que se dan al sujeto antes de que observe al modelo, y que le 
proporcionan una motivación alta o baja para prestarle atención y aprender 
la conducta dei modelo. La motivación elevada podría producirse al decirle 
al sujeto que será recompensado en proporción a la medida en que repro- 
duzca la conducta del modelo en una prueba posterior. Con instrucciones 
mínimas, el aprendizaje se clasifica fundamentalmente como “incidental”. 
2. Pueden darse instrucciones motivadoras después de que el sujeto contem- 
ple al modelo, y antes de que se jo someta a prueba. Esto ayuda a distinguir 
el aprendizaje de la ejecución de respuestas imitativas. 


tb ty 


Esta lista de variables en la situación de aprendizaje por observación no es ex- 
haustiva, y sélo intenta mostrar la extensión de posibilidades. El modelo puede 
transmitir una amplia gama de conductas en estas condiciones, y la fidelidad de la 
imitación del sujeto (incluso en condiciones de aprendizaje incidental) es a menudo 
notable. 

Como hemos dicho, la conducta del modelo se imita más frecuentemente cuan- 
do éste se ha recompensado en vez de castigado, Bandura demostrá que esta va- 
riable de recompensa-castigo afectaba la ejecución de respuestas imitativas por 
parte del sujeto, pero no su aprendizaje de las mismas. Después del ensayo de ob- 
servación, se ofrecían atractivas recompensas a los sujetos si reproducían las res- 
puestas del modelo. Este recurso incrementaba la exhibición de respuestas imita- 
tivas y eliminaba por completo el efecto diferencial de haber visto un modelo 
recompensado en contraposición a uno castigado. Ásí se descubrió que el observador 
había aprendido las respuestas del “muchacho malo”, aun cuando no las ejecuta- 
ba sino hasta que se le ofrecía el incentivo para hacerlo. 


Mecanismos del aprendizaje por observación 


Los mecanismos necesarios para el aprendizaje por observación han sido anali- 
zados con cierta amplitud por Bandura y sus asociados. En uno de sus libros (Ban- 
dura, 19715) se describe la investigación, y se le puede contrastar brevemente 
con la visión skinneriana (Gewirtz y Stingle, 1968). El análisis de condicionamiento 
operante del modelado se basa en el paradigma estándar de tres términos E*-R-E”, 
donde E* denota el estímulo de modelado (por ejemplo, el modelo se toca la ore- 
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jaizquierda), R representa la respuesta de igualación manifiesta que el observador 
ejecuta, y E' el reforzamiento proporcionado por algún agente para las respuestas 
de igualación (““imitación''). Acerca de esta reconstrucción paradigmática, Ban- 
dura afirma: 


El esquema anterior no parece aplicable al aprendizaje por observación, donde el obeer- 
vador no ejecuta manifiestamente las respuestas del modelo en la situación en la cual se 
rmuestran, los reforzamientos no se le administran al modelo ni al observador, y cualesquier 
respuestas que se hayan adquirido de este modo no se presentan durante días, semanas, 
e incluso meses. En estas condiciones, que representan una de las modalidades dorninan- 
tes del aprendizaje social, dos de los factores (R—E”) del pa de treselementos están 
ausentes durante la adquisición, y el tercer factor (E*%, o estímulo de modelado) gene- 
ralmente está ausente de la situación cuando se ejecuta primero la respuesta aprendida 
por observación... El análisis de Skinner esclarece la forma en que la conducta similar que 
una persona ha aprendido previamente es instigada por las acciones de otras y la perapec- 
tiva de la recompensa. Sin embargo, no explica cómo se adquiere mediante la observación 
una nueva respuesta de igualación en el primer lugar ... ese aprendizaje se produce por 
medio de procesos simbólicos durante la exposición a las actividades modeladas, antes de 
que se hayan ejecutado o reforzado cualesquier respuestas (197la, pág. 6). 


En su análisis del aprendizaje por observación, Bandura destaca cuatro subpro- 
cesos interrelacionados. Los procesos y algunas de las variables que los afectan se 
muestran en la figura 13.16. En primer lugar están los procesos de atención: el su- 
jeto debe prestar atención al estímulo modelado para que pueda aprender del mo- 
delo; se conocen varios factores que influyen en esta atención, incluyendo, por 
ejemplo, el valor funcional pasado de la atención a los modelos de un tipo y compe- 
tencia particulares. Se incluyen aquí las habilidades sensoriales del observador, así 
como el carácter distintivo de estímulo del modelo y de sus acciones modeladas. 
En segundo lugar se cuentan los procesos de retención, y su estudio ha sido el te- 
rreno especial de los investigadores de la memoria humana. Si la conducta del mo- 
delo ha de ejercer influencia en la conducta del observador en un punto muy pos- 
terior en el tiempo, entonces la conducta del modelo como evento de estímulo 
debe codificarse, representarse simbólicamente y retenerse durante ese intervalo, 

Para elaborar más este último punto, el aprendizaje por observación en los 
seres humanos implica dos sistemas de representación: uno imaginativo y otro ver- 
bal, Durante la exposición a los estímulos modelo, ocurren secuencias de expe- 
riencias sensoriales correspondientes (imágenes) que parecen asociarse o inte- 
grarse por la mera contigiiidad (véase el análisis efectuado por F. D. Sheffield 
(1961) acerca del aprendizaje de “programas detallados de acción perceptual'* 
que se mencionaron en el capítulo 4). Más tarde, la reanimación de las experien- 
cias sensoriales integradas guiará la conducta del observador en la imitación. La 
abundante investigación acerca de la imaginación mental en la memoria humana le 
confiere una credibilidad especial a esta forma de secuencias de eventos cognosci- 
tivos. El segundo sistema de representación, codificación verbal, puede diseñarse 
para que tenga niveles variables de eficiencia. En el nivel más sencillo, una vez 
que las etiquetas verbales ('*nombres'') están disponibles para el sujeto, éste 
puede describirse a sí mismo la conducta del modelo conforme se desarrolla, y en- 
tonces repetir y aprender esas descripciones verbales. El recuerdo posterior de 
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das mismas sirve como indicios para dirigir o guiar al sujeto a través de las res- 
puestas imitativas. En un experimento de Bandura, Grusec, y Menlove (1966) se 
manejaba este factor al hacer que los niños miraran un modelo (que se mostraba 
en una película) en tres diferentes condiciones. En una, el sujeto verbalizaba en 
voz alta la secuencia de respuestas nuevas que ejecutaba el modelo. En otra, se 
instruía al sujeto para que sólo observara con cuidado. En la tercera, se le pedía 
que contara con rapidez mientras miraba la película, y esto presumiblemente 
interfería con su verbalización y aprendizaje implícitos de la conducta del modelo. 
Una prueba posterior de ejecución, con incentivo alto o bajo para la imitación, de- 
mostró que los tres grupos se clasificaban en el orden en que los enumeramos en 
su habilidad para imitar la conducta del modelo. Es decir, los sujetos que descri- 
bían con palabras las conductas del modelo aprendían mejor, y aquellos que debían 
dedicarse a la tarea de interferencia de contar durante la observación, aprendían 
menos. 

En experimentos relacionados de Bandura y Jeffery (1973), y de Gerst (1971), 
se adiestraba previamente a los sujetos para que emplearan un vocabulario espe- 
cial para la codificación verbal de eventos perceptuales complejos. En el experi- 
mento de Bandura y Jeffery, el sujeto aprendía un nombre verbal para cada uno de 
varios movimientos de dos componentes que describían la trayectoria de una per- 
sona modelo para mover un punzón por un laberinto visual; la tarea criterio reque- 
ría que el sujeto aprendiera y reprodujera una secuencia de 12 movimientos (6 
movimientos de dos eslabones). En el estudio de Gerst, se mostraba a los sujetos eti- 
quetas para componentes del lenguaje de signos manuales de los sordos, y enton- 
0es se les comparaba con sujetos no preadiestrados en cuanto a su habilidad para 
aprender, a partir de una demostración visual de signos manuales, el modo de re- 
producir un conjunto de signos. Como cabría esperar, los sujetos a los que se les 
había enseñado un código verbal especial para componentes específicos de los mo- 
vimientos del modelo, segmentaron con facilidad la secuencia criterio modelada en 
estos componentes, los etiquetaron, repitieron las etiquetas y fueron muy supe- 
riores a los controles no adiestrados en lo que se refiere a su posterior habilidad 
para reproducir la ejecución criterio del modelo. 

Nada de esto es sorprendente, y mucho menos para los investigadores que es- 
tudian el papel de las representaciones cognoscitivas en la memoria humana. En 
realidad, la situación experimental no es muy distinta del estudio usual de labo- 
ratorio en aprendizaje verbal, donde un sujeto observa reactivos verbales ex- 
puestos por un tambor de memoria, y más tarde los recita de nuevo (y si son pa- 
trones familiares —palabras—, se adquieren con más facilidad que si se trata de 
reactivos sin sentido y desconocidos). En gran parte, también las variables simila- 
res a las que influyen en el aprendizaje verbal son aplicables al aprendizaje por ob- 
servación (por ejemplo, fuentes competitivas de control, interferencia proactiva y 
retroactiva, complejidad del material, etc.). Es decir, si el sujeto es expuesto a 
una “clase** de varios modelos que ejecutan varias acciones distintas, cabe espe- 
rar que (al igual que el aprendiz de pares asociados) se confunda al recordar qué 
modelo hizo esa ejecución y con qué consecuencias, 

Para retornar al análisis que hace Bandura del aprendizaje imitativo en la figura 
13.16 el tercer subproceso que destaca es el de las habilidades de reproducción 
motora. Un niño o un adulto puede saber de modo *“cognoscitivo”' y general lo que 
ha de hacerse (puede ''reconocer'” una ejecución correcta), pera, sin embargo, 
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ser relativamente inexperto en la ejecución misma. Los actos expertos como con- 
ducir 1n automóvil, bailar ballet o jugar golf generalmente requieren muchos com- 
ponentes pequeños, Aun cuando la secuencia de actos pueda comunicarse mediante 
la observación, la excelente coordinación motora necesaria dentro de los pro- 
pios componentes puede estar ausente en el novato, de modo que toda la ejecu- 
ción parece muy torpe. Á menudo las partes pertinentes del movimiento experto 
(por ejemplo, inclinar un hombro mientras se oscila el palo de golf) no son sobresa- 
lientes para el observador casual, o incluso para la rrusrua persona que lo ejecuta, y 
se necesita una práctica motora considerable con retroalimentación de los resul- 
tados para moldear gradualmente las habilidades motoras. Sin embargo —y para 
suavizar este punto—, se sabe que con algunas habilidades motoras como las re- 
queridas para el lanzamiento en baloncesto, para conducir automóviles o para el 
lanzamiento de dardos, la “repetición cognoscitiva'” secreta o la **práctica ima- 
ginaña'* a menudo puede producir significativas mejorías en la ejecución real (para 
una revisión, véase Richardson, 1969), 

El cuarto subproceso en el análisis de Bandura del aprendizaje por observación 
es el papel del reforzamiento. Bandura trata a la anticipación del reforzamiento 
como un Jactor motivacional que determina la expresión de cogniciones y conduc- 
tas aprendidas con anterioridad. Una persona tenderá a ejecutar o a inhibir una 
respuesta aprendida de forma vicaria según el grado en que crea que será recomper- 
sada o castigada por ejecutar el acto. El reforzamiento también puede alterar el nivel 
de aprendizaje por observación al afectar a quien o a lo que recibirá la atención del 
observador (por ejemplo, propiedades de estímulo de modelos atractivos y de 
prestigio), y cómo codifica y repite activamente la conducta modelada. Esta con- 
cepción del reforzamiento es parecida a la que adoptan la mayoría de los teóricos 
modemos del aprendizaje, con la llámativa excepción de los skinnerianos; ellos to- 
davía se apegan a una visión *“de fortalecimiento directo” del reforzamiento, y ex- 
plicarían la *““motivación de incentivo'” en términos del carácter de estímulo discri- 
minativo de las '“anticipacianes”” verbales del reforzamiento. 

Antes de finalizar esté tema es importante señalar que en un sentido práctico, 
un programa óptimo de adiestramiento para transmitir conductas a los seres hu- 
manos emplearía el método de observación conjuntamente con el reforzamiento 
diferencial. Al hacer que la persona observe un modelo, incrementamos la 
probabilidad inicial de quese produzca un patrón de respuesta que se asemeje al 
deseado. Después de que ocurra, la respuesta puede perfeccionarse o 
diferenciarse aún más y acelerar su tasa mediante el reforzamiento. Para algunas 
ejecuciones muy expertas, una vez que se ha iniciado la actividad, se derivan ma- 
yores beneficios de la práctica real en la habilidad, que mediante más observación 
del modelo. La división y el orden de la asignación de tiempo para observar un mo- 
delo en contraposición a la práctica con retroalimentación reforzante tendrá sin 
duda diferentes arreglos óptimos, dependiendo de la naturaleza de la tarea parti- 
cular cuya ejecución ha de moldearse. Al parecer, las preguntas acerca de la dis- 
posición óptima eh la actualidad carecen de respuestas generales, y cada una debe 
solucionarse er condiciones de campo apropiadas. 

Esta combinación de técnicas también ha probado ser muy efectiva para superar 
fobias neuróticas'en la práctica clínica. Muchas investigaciones han examinado téc- 
nicas para ayudar'a los pacientes a superar temores extremadamente debilitantes 
a las serpientes, ratas o arañas. En la situación modelada el paciente mira a otra 
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persona que lleva a cabo acercamientos cada vez más temerarios a una serpiente 
viva: esta exposición por sí sola reduce moderadamente el temor que experimenta 
el paciente y también incrementa su habilidad para aproximarse al objeto temido. 
Sin embargo, el procedimiento más efectivo consiste en que el modelo aliente 
verbalmente al paciente a que siga paso a paso sus audaces respuestas, de modo 
que la transferencia de las acciones del modelo se produce en pasos pequeños y 
progresivos que dan lugar a interacciones cada vez más osadas con el objeto te- 
mido. Esta técnica de modelamiento participativo probé ser muy efectiva para re- 
solver fobias clínicas en pacientes psiquiátricos. 

El aprendizaje por observación se ha examinado con cierta profundidad no sólo 
por el interés intrínseco del tema, sino también porque pone de relieve una de las 
diferencias entre la teoría del aprendizaje social y un análisis directo de condiciona- 
miento operante del mismo fenómeno. 


La motivación en las teorías cognoscitivistas 


La motivación se refiere fundamentalmente a la manera en que las acciones se 
activan y se seleccionan. Los teóricos cognoscitivistas presumen que la mayor 
parte de los instigadores internos o externos para la acción se transmiten por 
medio del sistema cognoscitivo de la persona. Los motivadores comunes incluyen 
la estimulación ambiental fuerte (calor, frío, descargas), y condiciones corporales 
como el hambre, la sed y la excitación sexual, El teórico cognoscitivista señalaría 
que la “fuerza motivacional” impulsora de estas condiciones para los seres huma- 
nos en gran parte se modifica mediante el sistema cognoscitivo. Así, los ascetas o 
las personas en huelga de hambre padecen hambre, y sin embargo, informan muy 
poco de la urgencia de comida que asociamos con el hambre extrema. Ásimismo, a 
las personas se les puede enseñar rutinas simples de relajamiento, distracción y 
antomanejo, que les permitirán soportar niveles de dolor que antes les resultaban 
intolerables (Meichenbaum, 1977). Los sujetos experimentales que han ayunado 
por un día, y que entonces acceden a una solicitud de continuar el ayuno para ma- 
yor experimentación, informan que sienten menos hambre, tienen menos ácidos 
grasos libres en la sangre (por lo normal un índice de hambre), y comen menos 
cuando a la postre se les den algunos bocadillos. Un libro editado por Zimbardo 
(1969), The cognifive contro! of motivatian, reseña diversos experimentos en los 
cuales los índices de conductas motivadas se manipulan de modo sistemático 
mediante cogniciones acerca del compromiso social, disonancia y autoestima. El obje- 
tivo de tales estudios es mostrar que los seres humanos no son instrumentos pasi- 
vos de sus impulsos biológicos o de la estimulación externa, sino que pueden con- 
trolar sus reacciones a esas fuerzas. 

En vista de las comodidades de nuestra opulenta sociedad, las fuerzas externas 
urgentes raras veces nos mueven; más bien las representaciones cognoscitivas en 
las cuales buscamos provocar consecuencias deseadas o evitar dificultades, son las 
que más a menudo nos motivan. Las cogniciones de las futuras consecuencias 
proporcionan la fuente aislada más grande de motivación para la acción humana. El 
reforzamiento y el castigo, otorgados o prometidos, afectan a la conducta debido 
en gran parte a que crean expectativas de que acciones particulares producirán 
consecuencias deseadas, Estas consecuencias esperadas proporcionan motivación 
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de incentivo para las acciones indicadas, de modo muy parecido a como lo conce- 
bían Hull y Spence. 


Reucciones emocionales 

Muchas emociones humanas se vinculan con pérdidas o ganancias esperadas, o 
son €l resultado de la evaluación de algún evento personal. Así, la expectativa de 
una ganancia o éxito crea excitación placentera y euforia; la expectativa del peligro 
y del daño físico genera ansiedad. La evaluación de un evento como causante de la 
pérdida de algo valioso crea sentimientos de tristeza o depresión. La cólera es el 
resultado de evaluar un evento social nocivo como un daño intencional deliberado 
contra uno mismo o hacia un ser querido. El alivio es el resultado de la eliminación 
del temor a una situación incómoda. Los psicólogos cognoscitivistas creen que las 
emociones reciben gran influencia de las evaluaciones cognoscitivas. El sistema de 
evaluación cognoscitiva es un conjunto de reglas —tal vez inconscientes, pero 
de todas formas modificables— para interpretar una variedad de sucesos so- 
ciales como buenos o malos, felices o tristes, amenazantes o inofensivos, Por 
ejemplo, una persona que sufra de depresión severa a menudo tiene reglas 
cognoscitivas internas que la hacen reaccionar con exageración a los eventos so- 
ciales, de maneras autodespreciativas y contraproducentes. Así, interpreta un 
cumplido como una expresión de lástima hacia ella, generaliza cualesquiera de sus 
pequeños errores como prueba de una insuficiencia grave, y se lanza a conclusio- 
nes autodenigrantes a partir de la evidencia neutral (Beck, 1976). Esta persona 
sabe cómo arrebatar la derrota de las fauces de la victoria. 

Una ventaja de concebir a las emociones de este modo es que sugiere técnicas 
terapéuticas para aliviar la depresión, la timidez, la infelicidad y la ansiedad. Un 
procedimiento básico consiste en atacar los pensamientos inapropiados a fin de de- 
mostrar la falta de lógica de las inferencias, y sugerir reglas sustitutas que conduz- 
can a evaluaciones más realistas y menos incapacitadoras. Esta forma de restruc- 
turación cognoscitiva se emplea con frecuencia en los programas de modificación 
de laconducta (Beck, 1976; Ellis y Harper, 1973; Michenbaurn, 1977). 


Procesos autorreguladores 


Una segunda fuente de motivación cognoscitiva reside en el establecimiento de 
meta y en el autorreforzamiento. La automotivación es el resultado del estable- 
cimiento de metas y definición de estándares mediante los cuales las personas 
evalúan su conducta. Las personas se entregarán a la tarea de alcanzar una meta 
particular y evaluarán su ejecución en relación con ese objetivo. Se recompensa- 
rán a sí mismas con autosatisfacción si alcanzan su estándar, pero estarán insatis- 
fechas y tal vez incluso se castiguen si no logran conseguirlo. Estas autoevaluacio- 
nes proporcionan fuerza de incitación a las metas que las personas fijan para sí 
mismas. El sistema autorregulador les permite trabajar en pos de metas conductuales, 
incluyendo la de volverse independientes del control de otros seres humanos, 

Los teóricos del aprendizaje social han escrito e investigado acerca de múltiples 
aspectos de la autorregulación (Bandura, 19772, 1977b). Una tarea consiste en 
describir cómo aprenden los míños los componentes de la autorregulación. Estos 
componentes incluyen el establecimiento de estándares por lograr, el monitoreo de 
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ha propia ejecución, la evaluación de la misma de acuerdo con su aproximación al 
estándar, y el recompensar la propia ejecución en la consecución del estándar. Al 
comprender mejor los componentes del proceso, es posible enseñar habilidades 
en autorregulación a niños o adultos deficientes en algún aspecto, y que desean 
controlar mejor su propia conducta. 

Un problema estudiado con especial atención es la forma en que los niños 
adquieren patrones de evaluación. Esto se produce principalmente a partir de la imi- 
tación de los estándares modelados por los familiares, compañeros y figuras famo- 
sas en los medios de comunicación. Además, los niños adquieren patrones mora- 
les y éticos mediante los ejemplos de sus padres y maestros; gracias al modelado 
también aprenden a justificar sus estándares con apelaciones o argumentos morales. 

Los psicólogos han estudiado la forma en que una persona debe establecerse 
metas a fin de motivar el logro óptimo. Todos concuerdan en que es mejor tener 
una meta claramente especificada de moderada dificultad. Los objetivos dernasia- 
de fáciles o difíciles no son motivadores ni reforzantes en el momento de lograrse. 
A fin de obtener un objetivo difícil y distante, la persona debería fijarse una serte 
de submetas pequeñas e inmediatas que conduzcan a la meta distante. Así, una 
persona que intente bajar de peso tendría que proponerse pequeñas “submetas 
próximas” (como registrar y reducir el número de calorías ingeridas para cada mi- 
tad del día), en lugar de fijarse un objetivo lejano y difícil (como perder 5 kilogra- 
mos en 5 semanas), 

La autorregulación parece ser el quid de varios fenómenos investigados bajo 
otros nombres. Por ejemplo, la motivación de logro de un individuo se refiere al 
grado con el cual el sujeto establece habitualmente patrones de ejecución muy al- 
tos para sí mismo y se priva, por voluntad propia, de las recompensas personales 
hasta que alcanza esos estándares. Un segundo fenómeno de los procesos auto- 
rreguladores es el papel del **conocimiento de los resultados” en los usuales estu- 
dios de laboratorio del aprendizaje y la ejecución, El conocimiento de la ejecución 
refuerza y motiva sólo cuando el sujeto se ha fijado estándares por alcanzar y pue- 
de evaluar su propia ejecución. Tales patrones se especifican generalmente me- 
diante las instrucciones del experimentador. Los sistemas de recompensa exter- 
nos (como las estrellas doradas en la guardería infantil) son poderosos porque 
inducen a los sujetos a fijarse metas y evaluar su ejecución de acuerdo con lo es- 
tándares de su “entrenador” (Locke et al., 1970). 

Dentro de la bibliografía acerca de la autorregulación se discute mucho la inter- 
pretación del autorreforzamiento (Bandura, 19774; Rachlin, 1974). En apariencia, 
una persona que se prive de una recompensa libremente asequible cuando su con- 
ducta no llegue a sus estándares presentes, parece contradecir el principio hedo- 
nista del comportamiento animal. Sin embargo, Bandura y Mahoney (1974) 
demostraron que las palomas y los perros podían ser entrenados para que se ne- 
garan recompensas “libremente disponibles?” hasta que fubieran realizado una 
determinada cantidad de ““trabajo”” para ganarlas. En el régimen de entrenamiento 
se castigaba o no se reforzaba al animal cuando comía el alimento disponible antes 
de que hubiese ganado su recompensa mediante la respuesta instrumental previa. 
Una vez que la rutina trabajar-para-comer está establecida con castigo parcial, 
persistirá mucho después de que el castigo se elimine. Así, el animal parecía re- 
nunciar al placer inmediato, y se ohligaha a sí mismo a trabajar para merecer su re- 
compensa, Al parecer, un niño aprende técnicas de autocontrol y continúa em- 
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pleándolas a fin de ubtener reforzadores de apoyo similares por parte de sus 
padres o del ambiente social. Después de muchos años, los procesos de autocon- 
trol operan de modo automático, sin reforzadores de apoyo, a excepción del auto- 
elogio y el “respeto a uno mismo”. 

Una vez establecido, un sistema de autorreforzamiento produce regularmente 
dos consecuencias a raíz de una acción relevante: un autoevaluación y una conse- 
cuencia externa (quizá una recompensa o castigo autoadministrados). Estas con- 
secuencias por lo general operan juntas para acrecentar o suprimir la conducta; 
así, un estudiante se elogiará a sí mismo e irá al cine si estudia durante más tiempo 
de lo que establecía su meta. El elogio y el cine sirven como motivación de incen- 
tivo antes de la conducta de estudiar y durante su transcurso. La autocensura y 
los castigos externos motivan de modo similar las conductas que evitan esa censu- 
ra y esos castigos en el futuro. El problema que se discute es si la alabanza o la re- 
probación autoadministradas en verdad fortalecen o debilitan la conducta, o si ape- 
ran principalmente al instigar o recordarle a la persona las recompensas externas 
que se ha prometido a sí misma por los logros. 

En algunos casos, la autoevaluación entra en conflicto con las consecuencias ex- 
ternas, como cuando desvalorizamos alguna acción por la cual los propios colegas 
nos recompensan, o cuando valoramos acciones que el grupo socíal ignora o Casti- 
ga. En estos casos, la autoevaluación a menudo gana para determinar la regulari- 
dad y persistencia de la conducta. Algunas formas de autorregulación son tan 
poderosas que la conducta puede desvincularse parcialmente de los sistemas socia- 
les de reforzamiento. Así, un artista pobre y desconocido que está convencido de 
que sus pinturas satisfacen las pautas artísticas más elevadas, despreciará la obra 
de sus coetáneos más famosos, y la considerará como trabajos vulgares y comer- 
ciales. Los individuos que poseen una gran fuerza de voluntad y autocontrol se ad- 
miran por su coraje e independencia si sus trabajos son prosociales (por ejemplo, 
inventores y poetas excéntricos), pero se les teme por su sinceridad si sus accio- 
nes son antisociales (asesinos psicópatas, dictadores sádicos). Bandura (19774) ha 
analizado las condiciones personales y sociales que pueden crear y mantener la 
conducta antisocial o deshumanizada. Su análisis tiene una especial importancia 
para tratar con la agresividad y el crimen. 


Las expectativas de eficacia y la ejecución 


La teoría de la expectancia de Tolman y la teoría de la decisión se concentraban 
exclusivamente en la expectancia del organismo de que una acción dada conducirá 
a una determinada consecuencia. Según el grado en que se desee y espere una 
consecuencia contingente a una acción, se seleccionará y se activará esa acción. 
Sin embargo, Bandura (19772, 1977b) ha observado otra expectancia que no figu- 
ra en la teoría de Tolman; es decir, la convicción que tiene el organismo de que 
puede ejecutar convenientemente la conducta requerida para producir las conse- 
cuencias. Bandura denomina a esta conducta expectación de eficacia, ya que consis- 
te en una predicción acerca de cuán eficaz o competente será la propia conducta. 
Las expectativas de eficacia difieren de las expectativas de consecuencia, que se re- 
fieren a la estimación que hace la persona de que una conducta dada conducirá a 
ciertos resultados, En la figura 13,17 se ilustra el lugar de los factores que inter- 
vienen en las dos expectativas. Estas pueden diferenciarse con claridad en las 
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de las expectativas de eficacia en 
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personas con fluidez verbal. Así, una persona puede saber e iriformar que una recom- 
pensa seguirá confiablemente a una conducta dada (uná expectancia de consecuen- 
cia positiva), pero tener serias dudas acerca de su habilidad de ejecutar la conduc- 
ta con eficacia (expectación de eficacia baja). Estas expectativas también pueden 
invertirse. La expectativa de eficacia es similar a la variable del hábito, de Hull, 
«Ey, que denotaba el grado en el cual el organismo sabe cómo ejecutar la respues- 
ta R en la situación S. Pero, a esta construcción hipotética de la expectativa 
de eficacia, Bandura le atribuye más propiedades de las que Hull adjudicaba al Hz. 

Al igual que otras construcciones hipotéticas, las expectativas de eficacia están 
aseguradas en términos de qué condiciones externas las afectan y qué influencias 
ejercen a su vez sobre la ejecución. Las personas poseen expectativas de eficacia 
acerca de infinidad de respuestas en varias circunstancias. Un conjunto de expec- 
tativas de eficacia es muy parecido a uná larga lista de creencias personales acerca 
de competencias e incompetencias. En lo que toca a los efectos de la ejecución, 
Bandura supone que aquello que percibe una persona de la eficacia (destreza) de 
una conducta dada afecta al que use o no esa conducta al afrontar situaciones difíci- 
les; influye en el esfuerzo que dedicará a la conducta o cuánto tiempo persistirá en 
ella al enfrentarse a obstáculos y frustraciones. Mientras más poderosa sea la ex- 
pectativa de eficacia, más tiempo y esfuerzo se dedicará a la conducta que se in- 
tente. Si la conducta persistente a la larga tiene éxito, la expectativa de eficacia 
para esa conducta en situaciones de ese tipo se acrecentará. Si la conducta se eje- 
cuta pobremente y fracasa, O se abandona antes de tiempo, su expectativa de efi- 
cacia para esa situación disminuirá. De esta forma, la expectativa de eficacia para 
una respuesta en una situación dada se ajusta a sí misma de acuerdo con las expe- 
nencias del sujeto con esa conducta. 

Bandura ha citado muchos factores que influyen en la expectativa de eficacia que 
una persona tiene en torno de alguna conducta (véase figura 13.18). 

Las cuatro principales fuentes de conocimiento acerca de la eficacia de una con- 
ducta en una situación dada son: 


Conducta ——_—— 


4 
Situación ! 
' 


1. Los logros pasados de la conducta de la persona. 

2. La observación de los éxitos o fracasos de otras personas con esa conducta. 
3. La persuasión verbal realizada por uno mismo o por otros. 

4. Los cambios en la propia excitación emocional en la situación de objetivo. 


En la figura 13.18 se enumeran varios procedimientos que ejemplifican fuentes 
particulares de conocimiento de la autoeficacia. La mayor parte de los procedi- 
mientos de la citada figura se refieren a técnicas de terapia de la conducta que por 
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Figura 13.18. Principates fuentes de expectativas de eficacia, y fuentes a través de las 
cuales operan diferentes modalidades de influencia (tomada de Bandura, 1977a). 


lo general se usan para vencer el temor, Esas técnicas se han investigado amplia- 
mente y su efectividad es muy variable. Bandura sugiere que los procedimientos 
de terapia basados en la ejecución como el modelamiento participativo (parte su- 
perior de la figura 13.18) resultan más efectivos que las técnicas de persuasión 
verbal o de reducción de emoción (desensibilización), ya que una ejecución exitosa 
proporciona una fuente más confiable de evidencia sobre la cual cambiar las pro- 
pias expectativas de eficacia, Así, la mejor base para predecir que usted será 
capaz de tocar una serpiente viva es el conocimiento de que realmente acaba de 
hacerlo, en Jugar de imaginárselo, 

En una investigación de Bandura (1977b), los pacientes que recibían tratamiento 
para la fobia a las serpientes daban puntuaciones de expectativas de eficacia en 
diversos momentos artes y después del tratamiento, así como durante su trans- 
curso. Los pacientes eran extraordinariamente exactos al estimar hasta dónde 
serían capaces de llegar en una serie graduada de acercamientos e interacciones 
con una serpiente. Esta estimación era la medición de la expectativa de eficacia. 
Los grupos de sujetos recibían distintos tipos de tratamiento para esa fobia, como 
la desensibilización imaginaria, el modelado o el modelamiento participativo. Los 
grupos diferfan considerablemente en el grado de variación en las conductas de 
aproximación a las serpientes. Además, estas modificaciones conductuales iban 
acompañadas de cambios similares en sus estimaciones de eficacia postratamiento 
en el acercamiento a los reptiles. La correlación entre cambios en las expectativas 
de eficacia y en la conducta de acercamiento era alta y casl idéntica en todos los 
grupos. Los tres programas terapéuticos influían de forma paralela sobre los cam- 
bios en las expectativas de eficacia y sobre la conducta. Asf, es posible afirmar que 
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los procedimientos de cambio de la conducta sólo son efectivos hasta donde 
modifiquen primero las expectativas de eficacia. Los críticos de la teoría argumen- 
tarían que las expectativas cambiadas de eficacia constituyen tan sólo un índice co - 
relacionado de modificaciones cunductuales manifiestas provocadas mediante el 
reforzamiento, pero por sí solas no originan esos cambios. Bandura (1978) ha apo- 
yado esta investigación con muchas vtras, ha defendido su teoría contra los 
ataques más severos. En la actualidad, la teoría es objeto de un análisis profundo y 
ha generado múltiples investigaciones. En años venideros cabe esperar desarro- 
llos significativos en la teoría de la eficacia. 


OBSERVACIONES FINALES 


Hemos revisado un número de características de la tcoría del aprendizaje social, 
ilustrándolas con el trabajo de su principal vocera, Albert Bandura. La teoría del 
aprendizaje social es híbrida; se trata de una forma de conductismo cognoscitivo 
que analiza el aprendizaje, la motivación y el reforzamiento de la conducta social en 
términos de sucesos cognoscitivos que median el impacto de los eventos 
externos, Por ejemplo, lo crítico de las contingencias de reforzamiento es la forma 
en que la persona las entiende y representa subjetivamente, no los parámetros 
objetivos de las mismas. En muchos aspectos, la teoría del aprendizaje social es 
compatible con versiones más liberales del conductismo. Un aspecto sobresalien- 
te del trabajo de Bandura es que evita Jus mecanismos de respuesta periférica y 
admite fácilmente los procesos cognoscitivos centrales (codificación, imaginación, 
representación simbólica, solución de problemas) en sus explicaciones teóricas del 
aprendizaje por observación, la autorregulación, el establecimiento de estándares, 
la autoeficacia y la planeación. Bandura ilustra con ejemplos y experimentos la for- 
ma en que esos procesos cognoscitivos controlan las influencias de las contingen- 
cias de reforzamiento en el control de las acciones, y determinan la manera en que 
las personas consideran y evalúan cuidadosamente las acciones sustitutas, o cam- 
bían sus conceptos de sí mismas. Los principios se aplican con ingenio a innumera- 
bles conductas sociales como la competencia, agresión, papeles sexuales, desvia- 
ción y conducta patológica (véase Bandura y Walters, 1963; Bandura, 1969, 
1977a). A grandes rasgos, la teoría del aprendizaje social proporciona la mejor sín- 
tesis integradora de lo que la moderna teoría del aprendizaje aporta a la solución 
de problemas prácticos. También brinda un marco de referencia compatible den- 
tro del cual se puede colocar a las teorías del procesamiento de la información, de 
la comprensión del lenguaje, la memoria, la imaginación y la solución de proble- 
mas. Estas teorías, por su parte, suministran los detalles de los “sistemas de 
representación”' y Jos “*procesos simbálicos”, a los que se menciona en las aplica- 
ciones de la teoría del aprendizaje social. Por estas razones, la teoría del aprendi- 
zaje social puede proporcionar una base de consenso para gran parte de las inves- 
tigaciones del aprendizaje en la próxima década. 
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LECTURAS COMPLEMENTARIAS 


G. H, Bower editó un volumen anual de su trabajo experimental y teórico; estos volúme- 
nes abarcan las principales áreas de la teoría del aprendizaje y se han publicado regularmen- 
te desde 1967. 
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theory, vol. 1 (1967) a vol, 13 (1979) y demás. 
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Anderson, J. R, y Bower, G. H., Human associative memory, 1972. 
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Crowder, R., Principles of leaming and memory, 1976. 

Estes, W, K. (dir.), Handbook of learning and cogniiive processes, 5 vols., 1975-1973. 
Lindsay, P. H. y Norman, D. A., Human information processing, 1972. 
Melton, A. W. y Martin, E. (dirs.), Coding processes in himan memory, 1972, 
Neisser, U., Cognifion and reality, 1976. 

Nisbett, R, y Ross, L., Human inference, 1979. 

Norman, D, A, y Rumelhart, D., Explorations in cognition, 1975. 
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Staats, A. W., Social behaviorism, 1975. 

Wickelgren, W. A., Cognitive psychology, 1979. 
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Neurofisiología 
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aprendizaje 


No hay nada tan cierto como la aseveración de que nuestra conducta es produc- 
to del sistema nervioso. La proposición es casi más tautológica que fáctica. En 
este sentido, cabe preguntar por qué las teorías de la conducta aprendida no han 
sido más explícitamente neurofisiológicas en su contenido, construcciones hipoté- 
ticas y referencias. 

Hay muchas, y muy diversas razones históricas que explican este largo divorcio 
entre la neurofisiología y la teoría de la conducta, y no intentaremos exponerlas. 
En primer lugar, durante e] periodo comprendido entre 1930 y 1960, cuando se 
desarrollaron la mayor parte de los motivos centrales de los actuales enfoques del 
aprendizaje, se creía que la neurofisiología tenía poco que ofrecer a la solución de los 
problemas psicológicos de la época. Pero con el gran auge de la investigación 
neurofisiológica en los últimos veinte años, este prejuicio comienza a desaparecer. 
Segundo, las principales teorías nunca intentaron describir los eventos específicos 
y reales tal como ocurren en el sistema nervioso de su aprendiz modelo. Las tácti- 
cas han sido —y en gran medida todavía son— las del conductismo descriptivo, 
complementadas por la teorización de la variable interviniente. La descripción de 
las relaciones genéricas E-R se encuentra en un nivel: si usted insta a sus sujetos 
a que hagan tal y tal cosa, se comportarán de tal y tal forma. El “*tal y tal”” en cada 
caso puede reemplazarse con una lista algo extensa de las variables que se consi- 
deren pertinentes. 

En otro nivel de teorización, se postula sólo la existencia, dentro del organismo, 
de ciertos mecanismos primitivos que desempeñan funciones particulares o que 
son gobernados por un conjunto determinado de reglas. Las implicaciones conduc- 
wales de los mecanismos postulados más sus reglas de operación se infieren en- 
tonces para los diversos conjuntos de condiciones fronterizas en las cuales ha de 
observarse el organismo modelo. 
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Niveles de discurso 


Tales teorías psicológicas operan en un nivel de discurso completamente distin- 
to que las teorías fisiológicas, y lo que son nociones primitivas en un nivel constitu- 
yen mecanismos en extremo complicados cuando se consideran desde el otro ni- 
vel. Por ejemplo, un programa de computadora para simular la recuperación de un 
hecho y la contestación de preguntas en los seres humanos, debe tener diferentes 
componentes para: almacenar hechos, analizar e interpretar preguntas, buscar en 
la memoria estructuras de igualación, recuperarlas y elaborar respuestas acep- 
tables. Pero incluso esta breve caracterización ignora los problemas en verdad 
difíciles de inferencia y deducción que están muy entrelazados con la contestación 
de preguntas. Los programas de computadora para sinular esas actividades (véa- 
se el capítulo 12) postulan una serie de mecanismos de procesamiento de informa- 
ción y de almacenamiento, y una secuencia organizada de operaciones que un con 
junto de procesos (€) programa) ejecuta con una base de datos. Pero imaginemos 
la tarea de intentar comprender lo que el programa está haciendo (o trata de ha- 
cer) en términos de una enumeración momento a momento de las cargas eléctri- 
cas en los miles de transistores, o en términos de la alineación de campo de los 
míllones de unidades de almacenamiento de núcleo magnético en la computadora, 
Supongamos que disponemos de información similar acerca de los estados fisio- 
lógicos de los doce mil millones de neuronas en el cerebro humano, cada una de 
ellas hasta con cinco mil sinapsis: ¡el número de posibles interconexiones excede 
al número de átomos en el universo! Esta gran cantidad de información y su fan- 
tástica complejidad nos dejarían atónitos; no tendríamos siquiera Ja esperanza de 
comenzar a introducir orden en esas cantidades tan vastas de información particu- 
lar. Más bien necesitaríamos algunas teorías o ideas muy poderosas acerca de la 
forma en que la información particular ha de organizarse en una jerarquía de con- 
ceptos de nivel superior que se refieran a la estructura y a la función (par ejemplo, 
para la computadora, la noción de un 5if, una “palabra”, un “registro”, una “di 
rección”, una ''instrucción””, etc.). Muchos psicólogos creen que su tarea consis- 
te en describir el programa funcional del cerebro a nivel de los mecanismos de 
procesamiento de información de un diagrama de flujo. Lo importante es el siste- 
ma lógico de partes que interactúan (el modeio), y no los detalles específicos de la 
maquinaria que podrían englobarlo en el sistema nervioso, La estructura del 
equipo es irrelevante para la pregunta científica fundamental, que se refiere a si el 
sistema teórico proporciona una explicación, descripción o predicción adecuada de 
los hechos centrales pertmentes a él. Si lo hace, entonces los psicólogos, en con- 
junto, quedan satisfechos con la teoría y están dispuestos a dejarla así. De hecho, 
afirman que cuando tienen una base firme, sus teorías, imponen fuertes restric- 
ciones a lo que serán teorías neuropsicológicas aceptables de la conducta. 

Por otra parte, los neuropsicólogos, se niegan a dejar las cosas en ese nivel y se 
dedican a investigar la estructura del equipo y los accesorios que la evolución ha 
instaurado en nuestros cerebros. Desean descubrir la maquinaria real y la forma 
en que funciona para lograr que un organismo entre en relación diaria con su am- 
biente. Es una meta sumamente difícil, ya que el sistema nervioso y su conducta 
son complicados, y ninguno de los dos se comprenderá a fondo durante mucho 
tiempo. En este capítulo nos ocuparemos del aprendizaje, y es probable que la habili- 
dad del sistema nervioso para almacenar información acerca de su historia sea su 
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capacidad más notable. También es una de las menos comprendidas en lo que toca 
al tejido nervioso. 

Un acto de aprendizaje o un acto de recuerdo tal vez implique a muchas partes 
distintas del sistema nervioso. Incluso una ejecución de la respuesta condicionada 
más simple puede fallar porque el organismo no ve el estímulo, no lo atiende o no 
lo registra con su sistema sensorial; puede fallar porque olvida cómo interpretar 
su significado, porque nunca lo aprendió, porque es momentáneamente incapaz de 
ejecutar las unidades motoras implicadas, porque ya no está motivado para hacerlo 
osencillamente porque no está de humor. Esta es una forma ambigua de caracte- 
risar la maraña de variables complejas que intervienen en cuándo y con cuánta fre- 
cuencia se ejecutará un acto aprendido. También demuestra el problema de deli- 
mitar el área de investigación denominada neurofisiología del aprendizaje. Por 
ejemplo, ¿debería incluirse la fisiología del receptor, puesto que la retina tiene que 
trasducir uma señal fótica antes de que pueda convertirse en indicio de una res- 
puesta aprendida? ¿Debería abarcarse el estudio de la acción muscular, puesto que 
los músculos ejecutan la acción aprendida? Por costumbre, tales temas se exclu- 
yen del área del aprendizaje, ya que se presume que estas estructuras operan de 
modo similar, independientemente de si interviene o no el aprendizaje. Por lo 
común, se supone que un destello de luz se codifica en la retina de una manera in- 
variante, ya sea si el destello de luz es neutral o si produce una expectativa de re- 
compensa o de castigo debida al aprendizaje pasado. Dada esta distinción fun- 
cional, la fisiología de los receptores y efectores por lo regular no se considera 
pertinente para el estudio del aprendizaje; su operación normal es una condición 
necesaria pero no suficiente para el almacenamiento de información. 

Por otra parte, la búsqueda principal de estructuras del aprendizaje se dirige 
desde estas estructuras periféricas hacia el interior del sistema nervioso central, 
al cerebro en particular. Desde luego, la pregunta fundamental se refiere a lo que 
sucede normalmente en el cerebro durante el aprendizaje. ¿Qué procesos y codifi- 
cación intervienen en el almacenamiento de información de una manera relativa- 
mente permanente? Una vez almacenada, ¿cómo se logra el acceso a esta infor- 
mación o la recuperación de la misma para guiar la ejecución posterior? ¿Qué 
estructuras anatómicas intervienen y cómo operan? ¿Pueden otras estructuras 
sustituir a las originales cuando estas últimas se inutilizan? ¿Qué cambia durante el 
aprendizaje y cuál es la naturaleza del cambio? ¿Córno persiste y qué lo destruye? 
Estas y muchas más son las preguntas globales que impulsan a la investigación del 
cerebro, Por supuesto, ninguna ha sido contestada de forma satisfactoria. Cada 
una de ellas plantea un enigma grande y complejo, y Sólo disponemos de unas 
cuantas piezas del rompecabezas que nos ayudan a inferir su naturaleza. 


Desarrollos técnicos 


La investigación de la neurofisiología del aprendizaje ha dependido considerable- 
mente del desarrollo de técnicas para sondear el interior del cerebro. Hasta la Se- 
gunda Guerra Mundial la técnica más común era la ablación, mediante la cual una 
parte del cerebro se destruía o se extirpaba. La técnica se perfeccionó mediante el 
desarrollo de la cirugía estereotáxica, a partir de la cual podía insertarse un 
electrodo en un punto preciso dentro del cerebro y causar allí una pequeña lesión 
al cauterizar las células cerebrales. Después de la ablación, se observan los déficit 
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de comportamiento del animal en una o más tareas de aprendizaje. La intención es 
deducir si la estructura cerebral ablactada interviene de algún modo en las ejecu- 
ciones observadas; pero esta inferencia no es definitiva y suele requerir evidencia 
de apoyo obtenida por otros métodos. Otras técnicas que proporcionan informa- 
ción acerca del cerebro incluyen el registro eléctrico de la actividad o estimulación 
artificial de componentes selectos del cerebro. En el registro eléctrico hay disposi- 
tivos para amplificar y registrar o mostrar los pequeños y veloces cambios de las 
señales eléctricas, que actúan como las “"voces”” de las células neurales. Tales 
amplificadores han permitido registrar una gama completa de la actividad eléctrica 
en el sistema nervioso, a partir del electroencefalograma (EEG) total obtenido de 
la cubierta exterior del cráneo, hasta el nivel de miniatura, que utiliza micro- 
electrodos para registrar la actividad de neuronas aisladas. Las computadoras de 
laboratorio también se emplean actualmente de modo rutinario para ayudar a los 
electrofisiólogos a registrar y detectar regularidades y relaciones válidas en cier- 
tas formas de registros EEG *'ruidosos'* en los cuales los eventos eléctricos 
significativos están oscurecidos por una actividad eléctrica aleatoria sin impor- 
tancia. 

En lo que se refiere a la estimulación, las principales técnicas que se aplican en la 
actualidad son aquellas que permiten la estimulación directa, eléctrica o química, 
en un área localizada del cerebro de ua animal intacto que está despierto, que se 
mueve y se comporta de forma normal, Pueden implantarse pequeños electrodos 
hipolares permanentemente en el cerebro del animal, con los cuales vivirá para 
siempre. Para estimular la estructura cerebral indicada, se conectan las termina- 
les de los cables que salen del cráneo a una fuente de energía eléctrica. De modo 
similar, se utilizan cánulas implantadas o pequeñas agujas hipodérmicas para in- 
yectar soluciones químicas o introducir sustancias químicas cristalinas en una par- 
te del cerebro. También se ha desarrolado una técnica que proporciona un 
muestreo y medición continuos de varias sustancias químicas neurales del ce- 
rebro. 

Esta técnica, conocida como sistema de meter-extraer, se refiere a dos cánu- 
las implamadas codo a codo en el cerebro; por una se introduce lentamente una 
solución neutral de ““baño'”, mientras que un sistema de succión extrae por la otra 
cánula las sustancias químicas neurales disueltas (de las estructuras que rodean a 
las extremidades de las cánulas), También pueden inyectarse pequeñas cantida- 
des de drogas de acción neural, y sus metabolitos u otros productos secundarios 
se recogen después de cierto tiempo, lo cual brinda un cuadro del curso temporal 
de captación y actividad de la droga. La existencia de muchas de estas técnicas 
crea condiciones que sin lugar a dudas son muy favorables a la expansión de la in- 
vestigación en neurofisiología, 

Los temas específicos que se examinarán en este capítulo constituyen una 
muestra seleccionada de los que se han investigado principalmente durante los úl- 
timos 35 años. Se incluye el trabajo acerca de la atención, la recompensa y la moti- 
vación debido a la influencia central de estos factores sobre el aprendizaje y la 
ejecución. 

En todos los casos, nuestra intención es presentar una idea del tipo de resultados 
pertinentes a cada tema, y describirlos en un lenguaje relativamente poco técnico, 
de modo que los lectores no familiarizados con la neurofisiología puedan compren- 
derlos. 
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MOTIVACIÓN, EXCITACIÓN Y ATENCIÓN 


La motivación y el aprendizaje guardan una íntima relación, sin importar la posi- 
ción que se adopte respecto al papel del impulso en la adquisición del hábito y en la 
ejecución de actos aprendidos. Por lo tanto, antes de pasar a los temas más estric- 
tos del aprendizaje de la memoria y la asociación, analizaremos el conocimiento 
neurofisiológico del impulso, la recompensa y el castigo, la excitación y la aten- 
ción. 


Mecanismos motivacionales en el cerebro 


La investigación fisiológica ha estudiado los mecanismos neurológicos que inter- 
vienen en los motivos biológicos comunes. La mayor parte de los trabajos se han 
ocupado de la sed, el hambre y el sexo. Por supuesto, el cuadro es todavía in- 
completo, pero al menos se ha avanzado algo. Á continuación analizaremos breve- 
mente parte de la evidencia acerca de los mecanismos neurales en el cerebro que 
ayudan a estas actividades consumatorias. 


Humbre 

El estudio del hambre es el más difícil debido a sus numerosas y complejas 
características. Los organismos, además de estar simplemente hambrientos de 
alimento en genera), también regulan la cantidad de tipos específicos de comida 
que ingieren, y lo hacen de acuerdo con los requerimientos especiales de sus cuer- 
pos en cuanto a carbohidratos, proteínas, grasas, minerales y vitaminas. Una 
diversidad de estudios de selección de dietas ha demostrado que los animales de- 
tectan sus déficit específicos y regulan la ingestión de las sustancias apropiadas 
con increíble exactitud. Estudios recientes han comenzado a esclarecer algunos 
de los mecanismos que sustentan esta exactitud en la selección de la dieta. García 
y Koelling (1966) descubrieron que un sabor nuevo puede asociarse selectivamen- 
te a un efecto secundario fisiológico interno (por ejemplo, náusea o malestar esto- 
macal) con demoras de varias horas. Se ha propuesto el mismo tipo de asociación 
para explicar la selección alimenticia de un animal con una deficiencia dietética par- 
ticular (Rozin, 1965, 1967; Rozin y Kalat, 1972). El sabor del alimento rico en la 
sustancia necesaria va seguido de un benéfico efecto interno, lo que origina que 
esa sensación de sabor se convierta en un “buen sabor”, que el animal! selec- 
cionará repetidas veces. 

A la par de esta mayor comprensión de las subhambres selectivas, se dispone 
también de muchos conocimientos acerca de la regulación de cuánta comida se 
consume en general. Aquí intervienen múltiples factores psicológicos y fisiológi- 
cos. El popular interés por el exceso de peso y por la salud ha dado lugar a varios 
estudios con personas obesas, y ya sabemos bastante acerca de este tema. Tales 
personas tienen más células grasas dispuestas a absorber nutrientes. Coro resul- 
tado, su ritmo metabólico es más bajo, de modo que queman calorías con mayor 
lentitud y ganan más peso por caloría ingerida que las personas delgadas. Asimis- 
mo, parécen tener una liberación condicionada más fuerte de insulina cuando ven 
(o piensan en) comida apetitosa. Esta liberación anticipatoria de insulina es similar 
ala respuesta condicionada de Pavlov, y es posible que sustente parte del intenso 
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*apetito'” que los estímulos alimenticios excitan en las personas ubesas. Con base 
en tales resultados, se contempla un tratamiento que consiste en extinguir la libe- 
ración condicionada de insulina al parear los estímulos alimenticios con una droga 
que inhiba dicha liberación. Se cree que esto reduce el apetito urgente o el ansia que 
el paciente siente cuando piensa en sus comidas favoritas. 

Muchas investigaciones se han centrado en los mecanismos cerebrales que sub- 
yacen ala alimentación en los animales. Las estructuras neurales primarias que in- 
tervienen en este proceso se encuentran en —o pasan por— el hipotálamo, locali- 
zado en la base del cerebro, directamente detrás de la garganta. El hipotálamo es 
una pequeña protuberancia de tejido en el cerebro humano más o menos del tama- 
ño de la punta del dedo meñique. Filogenéticamente es una parte muy antigua del 
cerebro, que a) parecer regula ciertas funciones biológicas, entre ellas el hambre y 
la alimentación. El »rúcleo ventromedial cercano a la línea media del hipotálamo pa- 
rece contener fibras que intervienen para detener el acto de comer o detectar la 
saciedad. Es decir, su funcionamiento normal aparentemente produce el cese de 
la actividad de comer después de que el anima! ha consumido una cantidad suf- 
ciente para eliminar cualquier déficit. Este núcleo ventromedial puede destruirse 
mediante una lesión electrolftica localizada; se coagula con una corriente eléctrica 
intensa administrada por medio de un electrodo implantado. Cuando se hace esto, 
el animal parece incapaz de dejar de comer durante un tiempo. Come excesiva- 
mente, en grandes cantidades (hiperfagia) y muy pronto se vuelve obeso, hasta al- 
canzar quizá más del doble de su peso normal. El exceso en el comer parece origi- 
narse en la ausencia de un mecanismo apropiado de ““detención'”, no en un impulso 
incrementado de hambre. Los animales húperfágicos no trabajan arduamente para 
conseguir su comida, y tampoco aceptan una gran alteración de su alimento por 
adición de quinina antes de rechazarla, mientras que aquellos normalmente 
hambrientos trabajarán con empeño y tolerarán el amargor de la quinina a fin de 
conseguir algo de comer. Schachter (1971) ha observado un cierto número de pa- 
ralelismos en los patrones de alimentación entre los animales hiperfágicos y los $e- 
res humanos muy obesos. 

Durante mucho tiempo, el historial de investigación pareció simple. Se creía que 
el núcleo ventromedial integraba señales de la boca, el estómago y ciertas sustan- 
cias nutritivas (por ejemplo, la glucosa) que circulaban en el torrente sanguíneo o 
en el fluido cerebroespinal; éstas estimulaban al núcleo y su actividad resultante, 
por medios desconocidos, detenía la actividad de comer. Así, si tal estructura se 
estimulara artificialmente con una corriente eléctrica (mediante un electrodo 
implantado) cuando un animal hambriento se encuentra comiendo, éste se verá 
inhibido a seguir alimentándose mientras se le aplique la corriente (Wyrwicka y 
Dobrzecka, 1560). Las respuestas aprendidas recompensadas con comida se inhibían 
de modo similar mediante la estimulación eléctrica del núcleo ventromedia). 

Las recientes investigaciones han complicado las cosas (Grossman, 1975). Una 
primera dificultad es que la hiperfagia y la obesidad se han producido por diminutas 
lesiones en otras estructuras cerebrales, en las que se originan fibras que pasan a 
través del núcleo ventromedial o cerca de él. Kapatos y Gold (1973), por ejemplo, 
lograron ratas hiperfágicas a partir de lesiones selectivas en el haz ventral nor- 
adrenérgico localizado a lo largo de los puentes y el cerebro medio, que manda 
fibras cerca del nácleo ventromedial del hipotálamo. Una segunda complicación es 
que al parecer el hígado tiene una importancia fundamental para señalar al cerebro 
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cuándo comenzar a comer o dejar de hacerlo, y el núcleo ventromedial y el nervio 
vago quizá intervengan en la recepción y emisión de estas señales. La función del 
hígado en parte controla el metabolismo, la descomposición y utilización del ali- 
mento (sustancias nutritivas) como energía. Por lo regular, el tejido adiposo (lo 
que comúnmente llamamos '“grasa'”) absorbe la grasa de los alimentos y de otras 
sustancias nutritivas durante la fase de absorción después de una comida, y enton- 
ces (como una esponja) las libera para la conversión de energía que se necesite du- 
rante el ayuno, entre las comidas. Según Friedman y Stricker (1976), la mejor 
explicación de la obesidad producida por lesiones ventromediales es que éstas re- 
ducen el metabolismo, con lo cual colocan continuamente al cuerpo de) animal en la 
fase de absorción; la **esponja*” adiposa constantemente absorbe sustancias nutri- 
tivas, nunca las vuelve a soltar, las células musculares claman por energía, y por 
eso el anima] come más, aunque permanezca letárgico y sin motivación. 

Los mecanismos “iniciadores”? del comer parecen encontrarse en (o pasar por) 
las áreas laterales del hipotálamo, una a cada lado de la línea media. La destrucción 
del hipotálamo lateral en ambos lados (ablación bilateral) provoca que un animal se 
niegue a comer (o a beber), y si no se toman medidas, morirá de inanición en una 
jaula repleta de comida, Teitelbaurn y Epstein (1962) informan que tales animales 
pasan por varias etapas mientras se les cuida para que se recuperen. Durante va- 
ros días después de la ablación bilateral, los animales (ratas) se niegan a comer o 
beber, y escupen las sustancias que se les coloca en el hocico. Se les mantiene con 
vida alimentándolos mediante una sonda con líquidos nutritivos directamente en el 
estómago. Pasados algunos días, todavía se niegan a beber pero ingieren alimen- 
tos sumamente azucarados. Más tarde, podrán ingerir la comida regular del labo- 
ratorio, aunque aún se negarán a beber. Posteriormente, en algunos animales re- 
torna la ingestión normal de líquidos. El que un animal se recupere o no y hasta 
qué punto parece depender de la extensión de la destrucción original: cuanto más 
grande sea la lesión, menos probabilidades habrá de una recuperación significativa. 


Sed 

El trabajo de ablación al parecer implica al hipotálamo lateral tanto en la ini- 
ciación del acto de comer como del de beber. Las dos funciones se han manejado 
por separado mediante estimulación eléctrica y química localizada. La estimulación 
eléctrica en esta área puede hacer que un animal saciado coma o beba dependien- 
do de la localización precisa del electrodo. La inyección de tna pequeña cantidad 
de solución salina en esta región del cerebro provoca que el animal beba con exce- 
so a pesar de que esté saciado; una inyección de agua pura hace que un animal se- 
diento deje de beber. En el caso de cada una de estas clases de estimulación, se ha 
demostrado que los hábitos aprendidos recompensados con comida o agua se re- 
gulan (se activan o desactivan) mediante la estimulación. Se tienen bastantes co- 
nocimientos acerca de los mecanismos que intervienen en la ocurrencia natural de 
la sed y el hambre. Las pérdidas de agua causan un incremento en la concentra- 
ción de electrolitos en la sangre, con un aumento resultante en su presión osmóti- 
ca, lo cual a su vez extrae más agua de los almacenes celulares del cuerpo. Un 
conjunto de células nerviosas que se encuentra en la cama vascular del hipotálamo 
lateral descarga señales de ''sed'” cuando se necesita agua. Estas células (deno- 
minadas osmorreceptoras) responden a un aumento en la presión osmótica de la 
sangre que las rodea. Una pequeña inyección de agua salina directamente en esta 
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área simula el efecto de una deshidratación prolongada al elevar la presión osmóti- 
ca en el tejido que circunda a los osmorreceptores, los cuales influyen en la pituita- 
ría. Esta segrega una hormona antidiurética que origina que los rifíones incremen- 
ten su reabsorción de agua, y aumenta la concentración de orina expulsada. Los 
riñones liberan angiotensina, que hace que los vasos sanguíneos se estrechen de 
modo que se eleva la presión sanguínea. La angiotensina también estimula al hipo- 
tálamo para que envíe ““señales de beber'” a la corteza. 

Una interesante serie de investigaciones iniciadas por Grossman (1960) estudia 
la especificidad química diferencial de los centros de comer y beber en el hipotála- 
mo lateral de la rata. Grossman descubrió que la inyección de ciertas sustancias 
químicas (drogas adrenérgicas como la adrenalina) en el hipotálamo lateral incre- 
mentaba considerablemente el consumo de comida, pero no la ingestión de agua. 
La inyección de otras sustancias (drogas colinérgicas como el carbacol) producía el 
efecto contrario: aumentaba el acto de beber pero no el de comer. N, E. Miller 
(1965) y Grossman (1957) han revisado muchos otros efectos químicos de este 
tipo. Aquí es interesante el hecho de que las drogas adrenérgicas que empleaba 
Grossman (adrenalina y noradrenalina) han sido identificadas como la sustancia 
neural y transmisora del sistema nervioso simpático, mientras que el transmisor 
para el resto del sistema nervioso es la acetilcolina, una sustancia colinérgica. La 
sensibilidad selectiva a las drogas adrenérgicas y colinérgicas de parte de los cen- 
tros de beber y comer sugiere otro fundamento para la diferenciación funcional 
de estos sistemas de impulso, pese a su superposición anatómica en el hipotálamo. 


Conducta sexual . ; 
Por último, consideraremos los centros cerebrales que intervienen en la con- 


ducta sexual. En Jos animales inferiores, dichas conductas se correlacionan 
estrechamente con las hormonas sexuales que circulan en el torrente sanguíneo: 
andrógeno (especificamente testosterona) liberado por los testículos del macho, y 
progesterona y estrógeno, segregados por los ovarios de la hembra. La elabora- 
ción y liberación de estas hormonas gonadotró picas es regulada a su vez por las pi- 
tuitarias. Al parecer, las hormonas sexuales influyen de múltiples formas en las 
conductas sexuales, principalmente en el área preóptica del hipotálamo, próxima a 
la pituitaria, Las ablaciones en algunas áreas originan una pérdida total de la con- 
ducta sexual, mientras que en otras regiones provocan una conducta sexual exa- 
gerada. En las ratas macho se produjo una actividad sexual excesiva mediante la 
estimulación eléctrica en la región anterior dorsolateral del hipotálamo. El 
estímulo eléctrico provocaba la monta persistente de una hembra y originaba ex- 
cesivas eyaculaciones, más allá del requisito de saciedad propio de un macho nor- 
mal. Un trabajo anterior de Fisher (1956), en el cual se inyectó testosterona en el 
hipotálamo de la rata macho, dio lugar a resultados similares (véase también a Da- 
vidson, 1966). La aplicación de la hormona en un área (preóptica lateral) desenca- 
denaba una conducta sexual exagerada en la rata macho y en la hembra. Cuando se in- 
yectaba en una región ligeramente distinta (área preóptica media del hipotálamo), tanto 
los machos como las hembras mostraban conductas ““maternales'*, como cons- 
truir un nido y adoptar crías ajenas. Estos comportamientos aparecen normalmen- 
te sólo en ratas hembra, después de dar a luz, Cuando se administra testosterona 
a una zona intermedia entre estas dos regiones, puede presentarse una conducta 
mixta: una rata macho alterna entre la construcción del nido y el apareamiento con 
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una hembra disponible. Michael (1962) informa de un aumento similar en la con- 
ducta sexual de gatos hembra, al implantar en el hipotálamo de los animales pe- 
queñas bolitas de parafina con estrógeno. Esto hacía que la hembra se volviera se- 
xualmente receptiva (“en celo”*) por un periodo de 50 a 60 días, ya que la droga 
3e absorbía con gran lentitud. Aunque era sexualmente receptiva, la vagina y el 
útero no estaban en condiciones estruales; se le describiría conductualmente en 
celo pero no desde el punto de vista fisiológico, Además, el empleo de hormonas 
radioactivamente alteradas! para un rastreo ha demostrado que las regiones hipo- 
talámicas intervienen para succionar estrógeno del torrente sanguíneo. A partir de 
tales resultados, parece segura la conclusión de que el impulso y la receptividad 
sexua) se inducen mediante Ja estimulación hormonal directa del hipotálamo. 

Caggmla (1970) informó de una confiable sensibilidad sexual a la estimulación 
eléctrica. La estimulación eléctrica del hipotálamo posterior de las ratas macho 
producía copulación ligada al estímulo; si se encontraba presente una hembra re- 
ceptiva, el macho la montaría y copularía con presteza cuando la estimulación ce- 
rebral se iniciara y continuaría, posiblemente a través de varias eyaculaciones, 
siempre que se aplicara el estímulo cerebral. También demostró que las ratas 
macho que reciben tal estimulación aprenden y ejecutan con rapidez una respuesta 
de opresión de palanca, reforzada con el acceso a una hembra receptiva. Pero la 
conducta de copulación no era una simple reacción refleja; más bien dependía de 
k convergencia de los estímulos apropiados de apoyo externo (por ejemplo, una 
hembra receptiva tenía que estar presente para provocar la conducta), y de tejido 
cerebral que había sido preparado adecuadamente por medio del suministro nor- 
mal de hormona sexual del cuerpo. Sila rata macho estaba castrada, la frecuencia 
de la conducta sexual **provocada'* por la estimulación eléctrica disrminuía de for- 
ma gradual durante un periodo de días (posiblemente a medida que se metaboliza- 
ba el resto de la hormona sexual endógena), y a la postre el lugar del cerebro esta- 
ba “sexualmente inerie””. La reposición de la testosterona supuestamente 
devolvería la conducta sexual controlada mediante estimulación eléctrica. 

Para concluir, vale la pena señalar que en el hipotálamo se encuentran importan- 
tes estructuras dentro de cada sistema pulsional. Se sabe que el hipotálamo controla 
otras conductas (por ejemplo, la agresividad) y regula varias funciones fisiológicas (la 
temperatura corporal). Asimismo, la estimulación eléctrica en esta área a menudo 
produce efectos de recompensa o de castigo. La efectividad del choque cerebral re- 
compensante en estos Sitios puede aumentarse o disminuirse al incrementar o 
decrementar, respectivamente, los niveles de hambre, sed o impulso sexual (Hoe- 
bel y Teitelbaum, 1962). De hecho, al hipotálamo se le podría denominar el centro 
motivacional del cerebro. Ahora parece plausible que una notable gama de varieda- 
des psicológicamente significativas tengan una incidencia ocasional en esta pequeña 
protuberancia compacta de tejido nervioso. 


Recompensa y castigo por estimulación cerebral 


Otro conjunto de estudios relacionados con los efectos de la recompensa y del 
castigo acentuó la importancia motivacional del hipotálamo. Una línea significativa 


lEsto se logra al agregar un isótopo radivactivo o de masa poco común, lo cual sirve para rastrear la 
hormona dentro del organismo (NV. del R. T.). 
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de investigación en los últimos veinte años se ha abocado al trazo de mapas con lo- 
calizaciones de los centros del castigo y de la recompensa en el cerebro de los 
maniúferos. Las observaciones iniciales acerca del efecto de la recompensa se de- 
ben a Olds y Milner (1954), y las que corresponden al castigo, a Delgado, Roberts 
y Miller (1954). Se prepara al sujeto experimental (generalmente una rata, gato o 
simio) con un electrodo bipolar implantado de modo que permanezca en su ce- 
ebro, con la diminuta punta estimulante del electrodo dirigida hacia una estructu- 
ra determinada del cerebro. Mediante este electrodo se suministra una pequeña 
corriente eléctrica a la región del cerebro que circunda a la punta del dispositivo, lo 
cual activa artificialmente una gran población de células neurales próximas al 
extremo del electrodo. En un típico experimento de recompensa, al sujeto se le 
permite operar un interruptor que administra breves descargas eléctricas a su ce- 
rebro. Si aprende a hacer esto repetidas veces, operando la palanca a una tasa 
apreciable, entonces Ja estimulación en esa parte del cerebro es recompensante. 
Por el contrario, si se abstiene de estimular su cerebro en condiciones óptimas de 
aprendizaje, la estimulación podría ser neutral o punitiva. Si es punitiva (aver- 
siva), el sujeto aprenderá alguna respuesta para interrumpir (escapar) la des- 
Carga cerebra) una vez que se presente, Mediante pruebas como estas, las estruc- 
turas cerebrales pueden clasificarse como recompensantes, neutrales o punitivas. 

Gracias a la investigación se ha descubierto que los lugares de recompensa es- 
tán densa y ampliamente dispersos en toda la subcorteza del cerebro de la rata. El 
esquema que se presenta en la figura 14.1 muestra uno de los principales sistemas 
de recompensa positiva (denominado SKCA, por sustrato de recompensa del ce- 
rebro anterior): un **tubo”” largo de fibras en el piso inferior, que se extiende des- 
de el cerebro posterior a través del cerebro medio (hipotálamo), y adelante hacia 
el cerebro anterior. Los sitios en donde la estimulación eléctrica produce efectos 
punitivos se ubican por encima de las fibras de recompensa, En la figura 14.1 se 
les denomina SECM (por sustrato de escape del cerebro medio). Desde luego, 
estos efectos dependen de la intensidad y de otras características de la estimula- 
ción eléctrica del cerebro. La intensidad de la estimulación debe exceder cierto 
valor de umbral para que se observe su efecto conductual, y la tasa de respuesta 
generalmente se incrementa con la intensidad del estímulo hasta un nivel óptimo. 
Roberts (1958) y Bower y Miller (1958) informaron por vez primera acerca de co- 
locaciones de electrodos (en gatos y ratas, respectivamente) donde el inicio de la 
estimulación cerebral parecía ser recompensante, pero si se prolongaba durante 
cierto tiempo, se volvía aversiva después de unos cuantos segundos. Por lo tanto, 
los animales aprenderían a ejecutar una respuesta para iniciar el estímulo, y otra 
para eliminarlo. Estos efectos duales parecen surgir porque aunque la punta del 
electrodo está localizada entre células de recompensa positiva, hay células negati- 
vas cercanas, de modo que durante los pocos segundos de la descarga, el sitio 
efectivo de estimulación se extiende desde la punta del electrodo y activa las célu- 
las negativas. Algunos de estos sitios ambivalentes aparecen dentro de círculos en 
la figura 14.1. Otra posible interpretación es que el estímulo eléctrico se autoadap- 
ta a la neutralidad a medida que continúa la estimulación, y se termina simplemente 
para liberar al sistema de la adaptación y para conseguir otro inicio de estimulación 
recompensante. Los experimentos de Deutsch (1973) hacen que esta última in- 
terpretación parezca un tanto más admisible. 

Se han descubierto varias características interesantes acerca del efecto de la re- 
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Figura 14.1. Secciones esquemáticas del 
cerebro de la rata que muestran las luca- 
lizaciones de los principales centros de 
reforzamiento positivo y negativo, los 
cuales se han determinado por estimula- 
ción eléctrica. La de arriba es una sec- 
ción sagital que corta el cerebro desde 
su parte anterior a la posterior, y de la su- 
perior a la base. La otra figura es una sec- 
ción horizontal en la que se aprecia, vis- 
ta desde abajo, la región interior media 
de) cerebro. Los efectos puros del casti- 
go se obtuvieron al estimular el sistema 
SRCA periventricular de fibras, denominado 
aqui SECM (sustrato de escape cerebral 
medio), los efectos puros de recompensa 
positivos se lograron con la estimulación 
del conducto hipotalámico lateral, que 
aqui se designa como SRCA (sustrato de 
recompensa del cerebro anterior). Los 
núcleos (circulos de la figura inferior) de 
estos sistemas producen resultados am- 
bivalentes, es decir, reacciones tanto po- 
sitivas como negativas. 


compensa eléctrica en sitios no ambivalentes. Primero, la conducta autoestirnu- 
lante no se sacia, en tanto que la mayor parte de los reforzadores positivos que 
ocurren de modo natural sí lo hacen, como comer o beber. Esta ausencia de sa- 
ciedad se infiere del hecho de que los animales continuarán estimulando sus ce- 
rebros a una tasa elevada durante varias horas, hasta que dejen de hacerlo por 
cansancio. Los pacientes humanos que han recibido estimulación en los supuestos 
“centros de placer”? de sus cerebros (durante experimentos realizados en el 
transcurso de una cirugía cerebral rutinaria), a menudo informan que la estimula- 
ción es placentera, satisfactoria o relajante, sin efectos secundarios desagra- 
dables, y de buen grado 5e someten a ella (Heath y Mickle, 1960). Segundo, la 
conducta por lo general se extingue con mucha rapidez cuando la estimulación 
eléctrica se desconecta, a pesar de que ha generado tasas muy elevadas de res- 
puesta. Tercero, en las situaciones de aprendizaje de ensayos discretos (por 
ejemplo, un laberinto) la ejecución suele ser más pobre cuanto más largo sea el in- 
tervalo interensayo. En muchos sitios del cerebro, el animal ““enfriado”' tiene que 
ser “instruido'” con una o más descargas cerebrales gratuitas antes de que inicie 
suacto de autoestimulación rápida. Cuarto, el efecto de la recompensa en algunas 
áreas parece depender del estado de uno u otro sistema motivacional (impulso). 
Las tasas de autoestimuación en ciertos sitios parecen obedecer al impulso de 
hambre del animal (la saciedad disminuye la tasa de autoestimulación), y en otros 
sitios depende del nivel de hormonas sexuales circulantes (la castración desciende 
la tasa de autoestimulación). Estos efectos relacionados con el impulso no se pre- 
sentan en todos los sitios recompensantes del cerebro. Además, muchos electro- 
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dos hipotalámicos que provocan respuestas consumatorias motivadas (comer, 
beber o copular) también resultan recompensantes en intensidades un tanto más 
bajas (Caggiula, 1970; Hoebel, 1968). Sin embargo, pareciera que estos efectos 
son mediados por grupos separados de células cerca del electrodo grande. Un es- 
tudio más analítico de Olds, Allan y Briese (1970), con la utilización de micro- 
electrodos, separaba las células donde la estimulación originaba el acto de comero 
de beber, de las células cercanas donde la estimulación sólo producía efectos re- 
compensantes, Los estudios anteriores habían usado electrodos más grandes que 
estimulaban varlos grupos de células, y cada grupo era responsable de evocar 
efectos funcionalmente distintos, 

Deutsch y Howarth (1963) presentaron una teoría acerca de la recompensa de 
estimulación cerebral que maneja muchos de los hechos pertinentes. La esencia 
de la teoría es que en estos experimentos de “recompensa” la estimulación 
eléctrica cumple en realidad dos funciones: recompensa para la respuesta inme- 
diata y motivación para la siguiente respuesta en la lista. Cada descarga cerebral 
produce alguna motivación para el hábito que provocaba el choque cerebral. La 
motivación originada por un choque cerebral decae con el tiempo transcurrido des- 
de la descarga, y a la postre disminuye a cero. Cuanto más fuerte sea el choque 
cerebral, más tiempo tardará en decaer ía motivación. El efecto postulado de una 
recompensa por choque cerebral se compara con el efecto familiar de comer 
nueces saladas; la conducta prácticamente es autoperpetuadora, pues el acto de 
comer tina huez mantiene el **'desco'” de otra, pero la urgencia de la necesidad 
disminuye con el tiempo transcurrido desde que se comió la nuez anterior. 

Deutsch y Howarth presentan varios resultados experimentales congruentes 
con su hipótesis, todos los cuales demuestran que la fuerza de la conducta estable- 
cida por una recompensa con choque cerebral declina con el tiempo transcurrido 
desde la última descarga. Gallistel (1966, 19694) ha confirmado y ampliado estos 
resultados de disminución de impulso. También descubrió (Gallistel, 1969) que 
en las ratas con dos electrodos de recompensa funcional implantados, la instiga- 
ción proporcionada en un electrodo todavía inyecta motivación para conseguir esti- 
mulación eléctrica (EEC) también por el otro. Como la teoría postula un efecto 
dual de la estimulación eléctrica (excitación de las sendas recompensantes y moti- 
vacionales), Deutsch y sus colaboradores han investigado qué medios pueden se- 
parar estos dos efectos. Los resultados de una serie de experimentos son cohe- 
rentes con la premisa de que la sensibilidad de ambos sistemas difiere conforme 
se varían los parámetros de estimulación (intensidad de la corriente, frecuencia 
del pulso). Las observaciones de un experimento sugieren que la senda motiva- 
cional posee un umbra) más bajo que la senda de recompensa. Así, un choque oe- 
rebral de baja intensidad podría tener efecto motivador pero no recompensante. 
En otro experimento, la frecuencia (pulsos por segundo) del choque cerebral se 
manejaba junto con la intensidad. Los pares de frecuencia e intensidad resultaron 
ser igualmente favorecidos (recompensantes) en una prueba de preferencia de la- 
berinto 7, pero motivaban de manera desigual en una prueba de pasadizo simple. 
Esto sugiere que las sendas de recompensa y de motivación son extremadamente 
sensibles a diferentes frecuencias de estimulación eléctrica. En otro conjunto de 
experimentos (Deutsch, 1964), se adujo evidencia para la opinión de que el ““pe- 
riodo refractario”” nervioso de las vías de reforzamiento es más corto que el de las 
vías motivacionales. El término periodo refractario se refiere a un lapso muy breve 
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que sigue a la descarga de una neurona y durante el cual un segundo estímulo es 
ineficaz y no puede descargar otra vez Ja neurona. Mediante pruebas estrictamen- 
te conductuales, Deutsch infirió que el periodo refractario para la vía recampen- 
sante era de alrededor de cuatro décimas de milisegundo, mientras que para la 
senda motivacional era de seis o siete décimas de milisegundo. Esta serie de ex- 
perimentos proporciona una extraordinaria evidencia para la hipótesis de Deutsch 
acerca de la recompensa de la estimulación cerebral. 


NEUROQUÍMICA DE LA RECOMPENSA Y 
DEL CASTIGO 


La investigación en neurofisiología ha probado que la transmisión de impulsos 
neurales es en gran parte una cuestión química. Las células nerviosas pueden con- 
cebirse como líneas telefónicas que se conectan entre sí en las coyunturas conoci- 
das como sinapsis. La línea A se conecta con la línea B por medio de una sinapsis, 
y ésta es responsable de transmitir a B cualquier impulso nervioso (señal) que 
viaje por la línea A. El nervio B tiene un umbral que la cantidad de estimulación 
debe exceder a fin de hacer que B dispare. Sin embargo, varios impulsos de sub- 
umbral desde Á que ocurran en rápida sucesión ““sumarán temporalmente”? sus 
efectos, y así harán disparar a B; o los impulsos de subumbral que llegan a B al 
mismo tiempo desde varias sinapsis distintas se “sumarán espacialmente'' para 
disparar a B. La transmisión de un impulso nervioso es en realidad el resultado del 
impulso en A, que causa un cambio en el potencial eléctrico a través de la membra- 
na del nervio B en el otro lado de la brecha sináptica, Este modelo de una neurona 
que se conecta con las otras es ideal; una neurona dada puede hacer crecer varios 
miles de dendritas que entablan contacto sináptico con miles de neuronas, y una 
neurona simple extendida puede recibir mites de contactos de otras neuronas. 
Axí, el patrón de influencias sobre el disparo de una neurona, y las influencias que 
ésta puede ejercer cuando dispara, son extremadamente complejos. 

Como hemos dicho, la transmisión de un impulso a través de una brecha sinápti- 
ca es un proceso bioquímico. En la figura 14.2 se presenta un diagrama del mismo 
para una sinapsis colinérgica ideal. Un impulso en la línea A libera (literalmente 
arroja a chorros en su extremo) una pequeña cantidad de sustancia fransmisora, 
que en este tipo de sinapsis es la acetilcolina (AC). Dicha sustancia química cruza 
la pequeña brecha entre Á y B y es absorbida por la membrana del nervio B, lo 
cual provoca un cambio momentáneo en el potencial de la membrana de este ner- 
vio. Si el cambio es lo bastante grande, genera un impulso eléctrico que se propa- 
ga hacia B. Después del disparo de B, intervienen procesos que limpiarán los re- 
siduos de la sustancia transmisora en la brecha sináptica, con lo cual la sinapsis 
regresa a su estado previo, lista para conducir otras señales. En las sinapsis coli- 
nérgicas, el proceso de limpieza lo ejecuta la enzima colinesterasa (CE), que 
hidroliza (neutraliza) la acetilcolina liberada en la sinapsis durante la transmisión. 
Las reacciones bioquímicas son aquí extremadamente rápidas, se efectúan en 
unos pocos milisegundos, y la acción recíproca de los sistemas AC y CE permane- 
cen en un equilibrio sincronizado y delicado de sinapsis. Los pequeños cambios en 
la asequibilidad de —o la velocidad de acceso a— una u otra sustancia química 
podrían dar lugar a un mal funcionamiento, o al menos a una disminución de la efi- 
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Figura 14,2. Ilustración de los eventos bioquímicos que intervienen en la transmisión 
sináptica. 


ciencia en la transmisión de patrones temporales finamente modulados de impul- 
sos neurales. 

En la figura 14.2 se ilustra una sinapsis colinérgica. Los neuroquímicos han des- 
cubierto de 10 a 20 tipos distintos de sinapsis en los mamiferos, cada uno de los 
cuales se asocia con distintas sustancias transmisoras, y se sospecha que existen 
más tipos. Los transmisores identificados hasta la fecha incluyen la acetilcolina, las 
catecolaminas (norepinefrina y dopamina), serotonina, ácido butírico gamma- 
amino (ABGA), glicina, ácido glutámico, ácido aspártico, y varias endorfinas como 
la enkefalina. Cada una tiene sus ubicaciones características en el sistema ner- 
vioso, su método de acción y sus formas de metabolización. Es probable que los 
diversos transmisores estén asociados con funciones diferentes y anatómicamen- 
te distintas del sistema nervioso, cada una de las cuales pudo haberse desarrollado 
en diferentes épocas de la evolución. 

Para los teóricos del aprendizaje tiene particular interés la conjetura de Larry 
Stein y sus colaboradores (Stein, 1964, 1969, 1978: Stein ef al., 1977) de que los 
principales circuitos neurales que sustentan la recompensa, el castigo y la conduc- 
ta motivada están bioquímicamente diferenciados, y varían en términos de las 
principales sustancias transmisoras utilizadas en las sinapsis de estos sistemas. 
Stein infiere estas propiedades bioquímicas de los sistemas at inyectar una va- 
riedad de drogas neuralmente activas, y observar sus efectos en los umbrales 
de autoestimulación recompensante y sobre el bloqueo o acrecentamiento de los 
efectos recompensantes o punitivos de los electrodos estimulantes. 

De acuerdo con las sugerencias implícitas en la bibliografía especializada, Stein 
observa que las recompensas pueden identificarse con lus eventos que tienen una 
función de activación excitadora (incentivo) o una función satisfactora-gratificante. 
Estas nociones están presentes en las teorías del reforzamiento de *“inducción del 
impulso” (excitación) en contraposición a la de ““reducción del impulso'” (relaja- 
miento), que son probablemente correctas pero incompletas. Stein sostiene que 
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las funciones excitatorias de las recompensas son mediadas por sistemas cerebra- 
les cuyo transmisor principal es una catecolamina, mientras que las funciones gra- 
tifícantes o relajantes son mediadas por diferentes sistemas cerebrales servidos 
en parte por una enkefalina o por péptidos tipo opiáceo. (Un péptido es una cadena 
de aminoácidos que sirve como bloque de construcción para las proteínas de las 
células.) Por último, Stein supone que los sistemas cerebrales que median los 
efectos punitivos sobre la conducta tienen serotonina como transmisor. 

Los argumentos para estas tesis giran en torno de muchos estudios acerca de 
los efectos conductuales de ias drogas. Primero, la autoestimulación recompen- 
sante es afectada selectivamente por la presencia de drogas que influyen en la 
transmisión en sinapsis centrales de catecolamina. Así, una droga como la anféeta- 
mina, que facilita la liberación de catecolaminas desde los axones presinápticos, fa- 
cilita la autoestimulación eléctrica; también hace que el cerebro sea más sensible a 
una estimulación eléctrica recompensante débil. Por otra parte, las drogas que re- 
ducen las catecolaminas o que bloquean su acción (como la reserpina y la cloropro- 
mazina) suprimirán la autoestimulación eléctrica en sitios de otru modo recompen- 
santes. La cloropromazina también hace al animal menos sensible a la recompensa 
cerebral, en el sentido de que se requieren intensidades más altas (amperes) para 
que el animal drogado desee el estímulo recompensante. Segundo, las inyecciones 
de serotonina o un precursor de la serotonina intensifican el efecto del castigo, 
mientras que las drogas contrarias a la serotonina disminuyen. Los efectos puniti- 
vos usualmente se evalúan en una situación conflictiva en la cual una rata presiona 
una palabra para obtener ocasionales recompensas de leche azucarada; sin embar- 
go, cada opresión de palanca se castiga con una breve descarga eléctrica en las pa- 
tas, calibrada en intensidad, a fín de producir un nivel moderado de opresión de 
palanca. En esta situación, las drogas benzodiazepinas (como el Librium y el Va- 
llum), que disminuyen la producción de serotonina, también incrementan la opre- 
sión de palanca, probablemente al disminuir el efecto del castigo. 

Otras evidencias para las conjeturas de Stein acerca de las funciones reforzan- 
tes provienen de los estudios de abuso de drogas en los seres humanos, y de ex- 
perimentos en los cuales se permite a los animales autoadministrarse drogas. 
Puede disponerse un experimento en el cual la respuesta de una rata de presionar 
una palanca provoque que una pequeña gota de alguna droga, como la cocaína, se 
administre directamente en la vena mediante una cánuia implantada de modo per- 
manente. (Otras drogas se inyectan directamente al cerebro.) En esta situación, 
los animales presionarán la palanca para autoadministrarse agentes facilitadores de 
catecolamina, como la anfetamina y la cocaína. Por supuesto, estas drogas también 
se las autoadministran los seres humanos (bajo los nombres populares de ““acele- 
re”? y '"coca””), quienes informan de sensaciones de excitación. Se trata de drogas 
“estimulantes”” que producen una “'aceleración”*. En el lado opuesto de la hipóte- 
sis de Stein acerca del relajamiento y la función reductora de impulso de las re- 
compensas, las ratas Oprimirán la palanca para autoadministrarse morfina, así 
como ina forma de enkefalina, en el ventrículo lateral del cerebro. La morfina y 
otros opiáceos producen sensaciones ilusorias de placer cuando se inyectan en los 
seres humanos. (La morfina se llama así en honor de Morfeo, el dios de los sue- 
ños.) La morfina y la enkefalina son asimismo poderosos calmantes (analgésicos). 

La conjetura de Stein también ha obtenido apoyo de los estudios anatómicos del 
cerebro de los mamíferos. Hay tres sistemas fundamentales de fibras ascendentes 
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en el tallo cerebral que tienen una catecolamina (dopamina o norepinefrina) como 
transmisor principal, y existe una gran superposición entre estos sistemas anató- 
micos con catecolamina y aquellos donde la estimulación eléctrica es recompen- 
sante. En confirmación a las hipótesis de reducción de impulso, de Stein, en varias 
pruebas realizadas hasta la fecha los sitios anatómicos que parecen ricos en enke- 
falina también producen recompensa positiva cuando se les estimula eléctricamen- 
te, Además, la droga naloxona, que es antagónica y bloquea la acción de la enkefa- 
lina, elimina el efecto recompensante de la estimulación eléctrica en los sitios ricos 
en enkefalina, Dicho sea de paso, la naloxona es antagonista de la morfina y se 
emplea para rescatar a las personas que han ingerido una sobredosis de heroína, 

En este trabajo resulta difícil separar los efectos de las dos catecolaminas, la do- 
pamina y la norepinefrina, ya que la primera es el precursor natural de la norep+ 
nefrina en las neuronas, y una droga dada por lo común afecta de la misma forma a 
la dopamina y a la norepinefrina. Pero ambos transmisores parecen desempeñar 
distintos papeles en lo que toca a efectos conductuales. La importancia de la nore- 
pinefrina se demostró en experimentos con varias drogas (como la disulfiram) que 
impiden la conversión de la dopamina en norepinefrina y, por lo tanto, hacen 
que esta última sea menos asequible para la transmisión. Tales drogas eliminan los 
efectos recompensantes de la autoestimulación; además, inhiben el efecto facilita- 
torio de las anfetaminas sobre la autoestimulación. Mientras estaba en marcha la 
inhibición con disulfiram, las inyecciones de norepinefrina en el cerebro de una 
rata causaban el retorno del efecto recompensante de la estimulación eléctrica. 
Tales resultados sugieren que la norepinefrina es uno de los transmisores críticos 
para el efecto de la recompensa. Pero también hay vías de recompensa en las 
cuales la dopamina sola parece actuar como transmisor efectivo. Baxter y sus aso- 
ciados (1974) descubrieron que las ratas se autoadministrarian ávidamente apo- 
morfina por vía intravenosa, la cual estimula los receptores de doparnina. Esta 
tasa de autoadministración de apomoríina no se afecta cuando a la rata se le pro- 
porciona también una droga que hace disminuir a la norepinefrina, pero se bloquea 
severamente si se le da una sustancia que antagoniza con la dopamina. La conchu- 
sión es que el fuerte reforzamiento positivo también puede ser el resultado de la 
activación del receptor de dopamina. Stein supone que el sistema de dopamina 
sustenta los aspectos de incentivo-motivación de la recompensa, mientras que 
la norepinefrina media los efectos de fortalecimiento de la memoria de las recom- 
pensas, El análisis de la influencia de estos sistemas neuroquímicos es un tema in- 
teresante de la agenda de investigación. 


Drogas que alteran el estado de ánimo 


E? lector habrá notado que muchas de las drogas mencionadas que alteran los 
efectos recompensantes o punitivos de la estimulación cerebral también se emplean 
comúnmente para modificar el estado de ánimo de los seres humanos, dentro o 
fuera de la situación psiquiátrica. De hecho, es esta correspondencia la que ha im- 
pulsado muchas teorizaciones acerca de la química neural del estado de ánimo y de 
la enfermedad mental. En la década de 1956 se descubrieron varias drogas antipsi- 
cóticas que tienen profundos efectos en la reducción de los síntomas psicóticos de 
la esquizofrenia, la psicosis maniaco-depresiva y otras perturbaciones afectivas. 
Las fenotiazinas (como la cloropromazina), butirofenomas (como haldol) y los alca- 
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lides rauwolfia (reserpina) son efectivos para aliviar síntomas de pensamiento 
desorganizado, desorientación, afecto embotado. retraimiento y conductas autis- 
tas características de la esquizofrenia. También se descubrieron diversas drogas 
contra la ansiedad, como las benzodiazepinas (Librium) y los propamediolos (Mil- 
town), Muchas de ellas afectan la transmisión de catecolamina, Por ejemplo, la re- 
serpina impide el almacenamiento de norepinefrina en sitios presinápticos, y la clo- 
ropromazina bloquea los receptores de dopamina en el cerebro, mientras que las 
benzodiazepinas hacen disminuir la producción de norepinefrina y de serotonina. 
Otras sustancias químicas que alteran el estado de ánimo son la imipramina, que 
facilita la transmisión de norepinefrina y se emplea en el tratamiento de la depre- 
sión; y las sales de litio, que disminuyen la transmisión de norepinefrina y se utili- 
zan para tratar psicosis maniaco-depresivas bipolares (endógenas). Los efectos de 
estas drogas sugieren que la depresión psicótica es causada por una disminución 
de catecolaminas en sitios normalmente recompensantes del cerebro y/o un exce- 
so de serotonina en las neuronas de los sisternas de castigo (y ansiedad). 

Stein y Wise (1971) señalan que la esquizofrenia sería el resultado de un des- 
equilibrio o lesión en los sisternas neuronales de norepinetrina del cerebro. Descu- 
brieron (1973) que una enzima usada en la conversión de dopamina en norepinetri- 
na aparecía en cantidades inferiores en el cerebro de esquizofrénicos sometidos a 
b autopsia, que en los cerebros de sujetos “normales” de control que habían 
muerto repentinamente en accidentes o por ataques al corazón. Desafortunada- 
mente. ese resultado específico no se ha repetido, y por eso se descartá la hipóte- 
sis. Aunque todavía no se ha probado ninguna hipótesis específica, el enfoque 
general de relacionar la neuroquímica de la recompensa con los desequilibrios 
mentales y con las alteraciones del estado de ánimo causadas por las drogas cons- 
tituye un avance significativo, interesante y fructífero en la investigación de los 
fundamentos físicos de la mente. 


Los calmantes en el cerebro 


El sistema de circuitos neurales que sustenta la percepción del dolor fue investi- 
gado durante años; se han identificado varios circuitos, incluyendo uno que va des- 
de el tallo y la médula del cerebro inferior hasta la médula espinal. Dos hallazgos 
recientes han abierto nuevos horizontes en esta área de investigación. El primero 
es el descubrimiento de varios sitios en el tallo encefálico (por ejemplo, la sustan- 
cia gris periaqueductal y el funículo dorsal-latera) donde la estimulación eléctrica 
produce una profunda analgesia (alivio del dolor). La estimulación parece actuar al 
inhibir la transmisión hacia arriba de las señales de dolor a través de los tractos es- 
pinotalámicos. El estímulo calmante del dolor también reduce los reflejos del dolor 
en niveles espinales inferiores. Por ejemplo, una rata que normalmente reacciona 
con rapidez cuando se le pincha una pata, no mostrará respuesta si el pinchazo 
tiene lugar durante la estimulación cerebral de la sustancia gris central (Mayer et 
al., 1971). Asimismo, las ratas que reciben descargas dolorosas en las patas pre- 
sionarán la palanca a fin de recibir estimulación inhibidora del dolor en la sustancia 
gris central. Tales estímulos eléctricos también se describen como calmantes en 
pacientes humanos que sufren dolor crónico debido a lesiones espinales. 

El segundo descubrimiento es que la analgesia producida eléctricamente es me- 
diada por la estimulación que provoca la liberación en estos sitios de varias sustan- 
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cias bioquímicas denominadas colectivamente endorfinas (que significa “morfina 
elaborada internamente'”). Las endorfinas son secreciones neurales que actúan 
como transmisores, de las cuales se han identificado diversas variedades (inctuso 
la enkefalina). Las endorfinas se denominan así porque en el bloqueo del dolor su 
acción se asemeja a la de la morfina. Esta similitud se observa en varios aspectos. 
Primero, los estudios anatómicos muestran que la morfina y las endorfinas com- 
parten centros similares de acción cerebral. Segundo, la inyección de pequeñas 
dosis de endorfina en el cerebro tiene los mismos efectos analgésicos que las pe- 
queñas inyecciones de morfina en los mismos centros. Tercero, la naloxona, una 
droga que bloquea las neuronas que reciben narcóticos, reduce la analgesia que se 
crearía ya sea al inyectar morfina o endorfina o mediante la estimulación eléctrica 
de la sustancia gris central, Cuarto, los animales se vuelven “tolerantes'* a la es- 
timulación eléctrica del área gris central porque las tandas sucesivas de estimulación 
terminan por tener menos efectos analgésicos, de modo parecido a como los adic- 
tos a la morfina (o a la heroína) requieren dosis cada vez mayores para sentir el 
mismo efecto. Además, una vez que un animal ha desarrollado tolerancia al cab 
mante del dolor provocado eléctricamente, también será tolerante a las inyec- 
ciones de morfina, Este paralelismo sugiere de nuevo que la analgesia producida 
eléctricamente actúa por el nismo medio que la morfina y otros opiáceos; es de- 
cir, la estimulación cerebral libera endorfinas. 

Tales resultados demuestran que el cerebro ha desarrollado su propio sistema 
de inhibición del dolor: éste y el estrés provocan la liberación de endorfinas en el 
cerebro para contrarrestarlos. La morfina sólo imita los propios mecanismos del 
cuerpo para aliviar el dolor. Al igual que la morfina, las endorfinas crean una sensa- 
ción eufórica que tal vez sea el agradable calor del alivio que a menudo sigue a la 
terminación del estrés prolongado. (Sería algo parecido a la **plenitud”” que los 
corredores de larga distancia describen tan a menudo.) Para el teórico del aprendi- 
zaje es interesante especular que la liberación de endorfina podría condicionarse a 
los estímulos previamente neutrales que anteceden al inicio del dolor (si el dolor 
causa la liberación de endorfinas). Esto ayudaría a explicar los efectos del placebo, 
donde las píldoras de azúcar etiquetadas como medicinales producen un alivio apa- 
rente del sufrimiento. La opinión de que la liberación de endorfina puede condi- 
cionarse explicaría un enigma muy antiguo: que los animales prefieren descargas 
dolorosas en las patas que están entrelazadas predeciblemente por un EC, que 
descargas similares en aquellas que son impredecibles. Si las endorfinas se libera- 
ran con antelación a las descargas predecibles, éstas se sentirían como menos pu- 
nitivas que las impredecibles. 

Estas cuestiones acerca de la neurofarmacología de la recompensa y el castigo 
se investigan en la actualidad, y continuamente se informa de nuevos resultados. 
Así, en un futuro cercano se desarrollarán prometedoras hipótesis. 


Excitación y atención 


Los estudios electrofisiológicos han revelado diversos aspectos de la excitación 
y la atención. La dimensión de excitación abarca variaciones que van desde la exci- 
tación eufórica, la atención alerta y la vigilia relajada, hasta la somnolencia y el 
sueño profundo. Tales estados se correlacionan estrechamente con las impre- 
siones fenoménicas de la vigilia consciente, como lo muestran los patrones distin- 


Cap. 14. Neurofisrología del aprendizaje 607 


tivos en el electruencefalograma (EEG) del sujeto. Con el EEG podemos estimar 
h profundidad del sueño. El EEG del durmiente procede a través de cuatro nive- 
ls distintos a medida que la persona cae en un sueño cada vez más profundo, pero 
entonces el EEG del sueño sube y baja con rápidas sacudidas en ciclos de alrede- 
dor de 90 minutos durante toda la noche. En la cúspide de estos ciclos, la persona 
entra en sueño de movimientos oculares rápidos (MOR) por varios minutos. Du- 
rante el MOR, el durmiente sueña y mueve los ojos como si mirara una escena 
que se desarrolla ante él (Kleitman, 1963). 

Numerosos estudios han considerado que el sistema de activación reticular 
(SAR) del eje cerebral tiene gran importancia en la excitación. Este sistema pare- 
ce intervenir en el sueño, en la vigilia, y en las graduaciones finas de la atención. 
Amtómicamente, este sistema —que en los seres humanos tiene casi el tamaño 
del dedo meñique (véase la figura 14.3)— se localiza en el centro del eje cerebral, 
exactamente sobre la médula espinal y debajo del tálamo y del hipotálamo. 

Acerca del SAR hay varios puntos esenciales bien establecidos. Primero, célu- 
las especiales de éste se excitan o se alertan cuando transmiten señales a través 
de los cables sensoriales de entrada que provienen de la piel, el oído, la nariz, et- 
cétera, Dichos cables sensoriales envían su información a zonas de “proyección ” 
específicas de la corteza cerebral, y todos (a excepción del olfato) lo hacen por 
medio de núcleos de relevo específicos que se encuentran en el tálamo, Sin em- 
bargo, en su camino hacia el interior, estos cables de entrada siguen por ramas co- 
laterales del SAR. En la figura 14.4 se presenta un esquema de esos colaterales. 
Dentro del SAR, los colaterales que provienen de los distintos canales sensoriales 
se entremezclan y pierden especificidad. Segundo, el SAR proyecta sus mensajes 
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Figura 14,3. Sección sagital esquemática del cerebro humano (tomada de D.P. Kim- 
ble, 1963). 
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no específicos sobre zonas amplias y difusas de la corteza cerebral (véase la figura 
14.4). La investigación indica que la probable operación de este sistema es la si- 
guiente: la información sensorial nueva estimula al SAR, el cual retransmite la pre- 
sencia de algún tipo de estimulación a diversas zonas sensoriales receptoras de la 
corteza. Esta estimulación difusa alerta a la corteza, al decirle que algo nuevo está 
por Negar. La corteza está entonces mejor capacitada para tratar con —o 
procesar— esta información específica, que llega por medio del canal sensorial 
específico de entrada. . 

Este cuadro se ha integrado con lentitud. La función alertadora del SAR se ha 
inferido del hecho de que la estimulación eléctrica directa del SAR despierta a un 
gato dormido y produce ondas cerebrales EEG características del estado de alerta 
y de la excitación. Si el SAR se destruye, el resultado es un coma profundo y dura- 
dero: el animal queda reducido a un vegetal. Las drogas anestésicas que producen 
inconsciencia parecen deprimir al SAR. El coma producido por ablación o median- 
te un anestésico persiste a pesar de que las vías de proyección sensorial perma- 
nezcan intactas. Aunque los sonidos, los contactos o las luces todavía provocan 
respuestas eléctricas definidas en la corteza mientras el animal se encuentra en 
estado de coma, el sujeto no percibe estas entradas porque el interruptor del SAR 
que controla la **conciencia** se ha apagado. Así, la estimulación no especifica des- 
de el SAR parece preparar a la corteza para procesar información sensorial de 
entrada. 

Los experimentos de Lindsley (1958) y Fuster (1958) proporcionan pruebas in- 
directas de la eficiencia perceptual de una corteza alertada, El estudio de Lindsley 
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demostró que la corteza estaba mejor capacitada para resolver y discriminar dos 
destellos de luz sucesivos si se le llevaba a un estado apropiado de preparación de 
alerta mediante la estimulación previa del SAR. Por su parte, el trabajo de Fuster 
comprobó que la activación previa del SAR permitía a los simios obtener más in- 
formación discriminativa a partir de un vistazo muy breve de una disposición visual. 


Bloqueo sensorial 


Recientemente, algunos experimentos han puesto en claro que el cerebro despier- 
toejerce un considerable control sobre los canales sensoriales de entrada. Las se- 
ñales eléctricas que entran provenientes de un receptor particular pueden estar 
sujetas a influencias moduladoras a lo largo de su vía sensorial hacia la zona recep- 
tora primaria localizada en la corteza. Estas influencias pueden inhibir o acre- 
centar la señal entrante, aunque la inhibición parece ser el modo predominante. 
Estos efectos se observan en Jos cambios de la respuesta provocada eléctrica- 
mente y registrada en las diversas estaciones de relevo (sinapsis) que se en- 
cuentran a lo largo del cable sensorial de entrada. Es probable que estas influen- 
cias sean mediadas por las fibras que parten de la corteza y del eje cerebral a lo 
largo del cable de entrada hasta las proximidades de los receptores periféricos. 
Mediante la estimulación eléctrica de ciertas partes de la formación reticular es 
posible producir cierto número de efectos de inhibición sensorial. 

Al parecer, la función centra] de estos circuitos nerviosos que van desde el ce- 
rebro hasta la periferia es similar a la que se adjudica a la *“atención””. Por este 
medio, el cerebro atenúa o ““bloquea”' las señales sensoriales que no le resultan 
“interesantes”” en ese momento, y al mismo tiempo amplifica el canal sensorial (si 
hay alguno) en el cual se concentra la atención. Las pruebas de la existencia de 
esta generalización provienen de los estudios acerca de la habituación y la distrac- 
ción, y la influencia que ejerce la estimulación cerebral en los potenciales provoca- 
dos por la estimulación sensorial. 

Consideremos en primer término al fenómeno de la habituación. Cuando un 
estímulo nuevo de suficiente intensidad actúa sobre un receptor, origina una res- 
puesta eléctrica enérgica y definida en los relevos de este casal de entrada, en la 
corteza sensorial primaria de dicho canal y en la formación reticular. Este es el 
acompañamiento eléctrico del “'reflejo de orientación”* que estudiaron Pavlov y 
Sokolovy (véase el capítulo 3). Sin embargo, si el estímulo se repite en una serie 
monótona y regular, la respuesta provocada disminuye hasta un nivel bajo y es- 
table que muchas veces ni siquiera se detecta: la respuesta se ha habituado. Esta 
habituación se encuentra no sólo en la corteza sino en partes muy inferiores, esen- 
cialmente en la primera estación sensorial de relevo que se ubica más allá del recep- 
tor, Se supone que este control de habituación está diseñado para desembarazar a 
Jos centros cerebrales superiores del trabajo con estímulos que han dejado de te- 
ner significación para ellos, La habituación puede disiparse temporalmente al mo- 
lestar al animal (con una descarga eléctrica en las patas o con un choque reticular 
excitador). Asimismo, se libera hasta cierto grado al introducir alguna modificación 
en el patrón de estímulo, La liberación de la habítuación parece seguir un gradien- 
te regular de generalización relacionado con la cantidad de carga de estímulo. Por 
otro lado, la habituación no se producirá si mediante el condicionamiento el 
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el aprendizaje, de la adjudicación de “significado” a los estímulos y de la forma en 
que la estimulación, en vez de efectuar un registro pasivo, se corrige y se distor- 
siona selectivamente según los propósitos del organismo despierto. 


APRENDIZAJE Y MEMORIA 


Un organismo que no pudiera aprender sería capaz, no obstante, de comportar- 
se de modo distinto en diversas condiciones de excitación motivacional; por 
ejemplo, podría alejarse de los estímulos nocivos y continuar reaccionando ante 
los favorables. Esa conducta produce aprendizaje sólo cuando se suscitan cambios 
en la experiencia; es decir, si las experiencias del pasado se almacenan de alguna 
forma en la memoria, de manera que cuando se encuentran otra vez los mismos 
estímulos, la reacción a éstos se altera por lo que sucedió antes. Por lo tanto, ne- 
cesitamos complementar la actual explicación de la actividad cerebral con lo que se 
sabe acerca de los cambios que aparecen cuando se produce aprendizaje, y acerca 
del almacenamiento y la recuperación de la memoria. 


Consolidación de las huellas de la memoria 


En términos generales, existen básicamente dos concepciones en torno de los 
fundamentos neurales de la retención de la experiencia o del aprendizaje. Una de 
ellas supone que una experiencia establece actividad eléctrica continua en los cir- 
cuitos nerviosos apropiados, y que la persistencia de estos circuitos activos se co- 
ordina con la persistencia de la experiencia que se codificó de ese modo en nuestra 
memoria. Cuando se detiene este proceso de huellas activas, perdemos esa me- 
moria. Á este fenómeno podemos denominarlo visión “*dinámica”” del engrama, o 
huella de memoria de largo plazo (ML.P). En oposición a este enfoque está la vi- 
sión *'estructural'*, según la cual el aprendizaje consiste en algún cambio duradero 
de tipo físico, estructural o bioquímico en el sistema nervioso, cambio físico que 
persistirá incluso cuando los circuitos neuronales originales responsables de su es- 
tablecimiento hayan regresado a la inmovilidad relativa a continuación de la expe- 
riencia inicial. 

No es necesario pensar ni experimentar mucho para rechazar la visión dinámica 
de la MLP. Por ejemplo, enfriar a un hámster hasta 5 grados centígrados lo hace 
hibernar y durante este tiempo en su cerebro hay muy poca o ninguna actividad 
eléctrica susceptible de ser registrada. Sin embargo, cuando se le calienta y se le 
somete a prueba, todavía retiene cualquier hábito antiguo que se le haya enseñado 
antes del periodo de hibernación. Como otro ejemplo considérense las *“tormen- 
tas cerebrales” eléctricas de los ataques epilépticos del gran mal en los pacientes 
humanos, Tales ataques comienzan cuando un foco epileptógeno local (causado 
por una lesión o un tumor cerebral, por ejemplo) empieza a extenderse a grupos 
de neuronas vecinas en su pauta de descarga anormal. Las neuronas caen en un 
sincronismo muy estrecho al dispararse al mismo tiempo que el foco epiléptico, y 
vuelven entonces hacia otras regiones. La zona efectiva de disparo se extiende 
muy pronto; casi toda la corteza se mueve sincronizadamente con el foco epiléptico 
y el ataque está en su apogeo: prácticamente todo el cerebro participa en este pa- 
roxismo. El ataque total puede durar unos cuantos minutos. Al recobrarse, el 
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paciente no ha perdido los recuerdos de su pasado, como lo señalaría la visión di- 
námica; de hecho, es difícil detectar que el ataque haya producido alguna pérdida 
de la memoria. Hay muchas otras pruebas que descartan la visión dinámica de que 
la memoria viye en un circuito giratorio continuo, de modo que tal conjetura asume 
prácticamente un estatus de nulidad. 

Así, mediante un proceso de eliminación, llegamos a la opinión aceptada de que 

la MLP implica un cambio físico o estructural relativamente permanente en el sis- 
tema nervioso. Aunque no podemos prejuzgar cuál es la naturaleza de este cambio 
Ésico, es inofensivo presuponer que el cambio tiene lugar en el lapso que sigue a la 
experiencia de aprendizaje, y hasta es probable que aumente de magnitud con el 
paso del tiempo. Si el periodo implicado es sumamente breve (supóngase que sólo 
se requieran unos cuantos milisegundos para completar el cambio), la noción del 
cambio temporal es irrelevante para los experimentos conductuales. Sin embargo, 
la noción tiene implicaciones conductuales de interés si el lapso es muy largo; por 
ejemplo, muchos segundos, minutos, horas o días. Es precisamente esta noción la 
que ha sobrevivido con la denominación de hipótesis de la ““consolidación””. 

Hace ya varias décadas, Miller y Pilzecker (1900) propusieron una variante de 
esa hipótesis. Sugirieron que Ja actividad neural responsable de almacenar un cam- 
bio físico que codifica una experiencia perdura un tiempo después de la experiencia 
y, a consecuencia de la actividad neural persistente, los cambios físicos se estable- 
cen con más firmeza y alcanzan una mayor magnitud. A esta fijación progresiva 
con el paso del tiempo se le llama consolidación. Si la actividad neural persistente 
pronto se interrumpe por la inclusión de alguna actividad interíerente, entonces el 
cambio físico es pequeño, y la retención de la experiencia será precaria. Hebb 
(1949) enunció rmuevamente esta hipótesis y estableció un modelo neurofisiológico 
más detallado. La hipótesis de Miiller y Pilzecker se planteó originalmente para 
explicar la interferencia retroactiva que se produce cuando los sujetos humanos 
recuerdan materiales verbales. En ese contexto, la hipótesis en cuestión no resul- 
16 muy fructífera y fue eclipsada por la teoría de la interferencia asociativa (véase 
A capítulo 6), que probó adecuarse más a los detalles de los hechos propios de 
este campo. El continuo interés por la hipótesis de la consolidación en parte pro- 
viene de las observaciones clínicas, pero principalmente de los experimentos rea- 
lzados con animales. La evidencia esencial para la teoría de la consolidación de la 
memoria procede de estudios acerca de lo que se produce al perturbar o traumati- 
zar el cerebro poco después de haber registrado una experiencia. En teoría, esta 
perturbación debería evitar la consolidación del análogo neural de la memoria, de 
modo que en una prueba posterior no se demostraría aprendizaje alguno. 

En este aspecto conviene considerar el sorprendente fenómeno clínico de la am- 
nesia retrógrada y anterógrada. Después de que una persona recibe un fuerte gol- 
pe en la cabeza o sufre alguna lesión cerebral traumática (como una herida en com- 
bate), que le produzca inconsciencia y estado de coma, es muy probable que al 
volver en sí se muestre un tanto desorientada y confusa. Aunque quizá responda a 
preguntas simples acerca de su vida, es incapaz de retener durante mucho tiempo 
los eyentos que tienen lugar a su alrededor. Esta se denomina amnesia anterógra- 
da, y significa que la víctima sufre amnesia de los eventos que ocurren justo des- 
pués de despertar de su accidente. Además, es probable que la víctima sea incapaz 
de recordar los eventos que ocurrieron inmediatamente antes del accidente y es- 
tán vinculados con él (la denominada amnesia retrógrada, que actúa sobre los 
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eventos anteriores al trauma). En la figura 14.5 se presenta un esquema de las 
porciones de las series temporales de la vida sobre las cuales se piensa que se ex- 
tienden las arnesias anterógrada y retrógrada (áreas sombreadas). 

El periodo retrógrado puede extenderse sobre los eventos ocurridos muchos 
minutos (de 5 a 60) antes del accidente, y el anterógrado puede abarcar un tiempo 
similar después de recobrar la conciencia; los eventos más próximos a estos dos 
marcadores de tiempo tienen mayor probabilidad de ser olvidados. En los casos 
más severos y dramáticos (W. R. Russell y Nathan, 1946) puede perderse la ca- 
pacidad de recordar los eventos ocurridos varias horas, días o meses antes del 
trauma, y se dice que un paciente en estas condiciones padece de amnesia. En la 
mayor parte de los casos, la persona a la postre recobra la memoria de lo sucedido 
con anterioridad al accidente, y lo que se recupera primero es lo más alejado de la 
lesión en el tiempo. Á medida que continúa la recuperación, pueden recordarse los 
eventos temporalmente más cercanos a la circunstancia traumática, pero lo común 
es que quede una porción irrecuperable de eventos inmediatamente anteriores a la 
ksión. Se ha informado de efectos semejantes, annque en menor grado, en pa- 
cientes humanos sometidos a los efectos de la anestesia profunda que han sufrido 
convulsiones producidas por insulina y metrazol, y choques electroconvulsivos. La 
hipótesis de la consolidación interpretaría la amnesia retrógrada en el sentido de 
que Ja Jesión o el trauma impide la consolidación de material reciente, y eleva ade- 
más el umbral de evocación de los recuerdos ás antiguos, que han tenido mucho 
tiempo para consolidarse y son más fuertes. Durante la recuperación declina el 
umbral para la evocación, de modo que los recuerdos más antiguos y vívidos son 
los que retornan primero. Posteriormente veremos teorías que explican estos 
hechos de otra manera. 


Choques electroconvulsivos y amnesia 


En el trabajo experimental acerca de la amnesia en los animales (por lo común 
realizado con ratas), gran parte de los primeros estudios investigaban la forma en 
que se perturba el aprendizaje cuando el sujeto recibe una descarga electroconvul- 
siva (DEC) poco después de un ensayo de aprendizaje. La convulsión, en muchos 
aspectos similar a la tormenta cerebral sincronizada en un ataque epiléptico, se 
induce con facilidad al hacer pasar brevemente una fuerte corriente eléctrica entre 
los electrodos insertados en las orejas de una rata. A partir del trabajo de Duncan 
(1949), diversos estudios han demostrado que el DEC aplicado a una rata poco 
después de un ensayo de aprendizaje interfiere con su ejecución del hábito apro- 
piado cuando se le somete a prueba al día siguiente, después de recobrarse de la 
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Figura 14.6, Promedio de carreras anticipatorias (respuestas de evitación) correspon- 
diente a 18 ensayos, relacionado con el logaritmo del tiempo de demora entre el en- 
sayo y el choque electroconvulsivo. Los diferentes puntos de la curva (en los cuales 
se indican los tiempos de demora) representan distintos grupos de sujetos animales 
[tomada de Duncan, 1949) 


corta convulsión. Además, cuanto más cerca del término del ensayo de aprendiza- 
je se aplique la DEC, mayor será la perturbación de la ejecución que aparece en la 
prueba subsecuente. 

Este efecto se ilustra con el experimento inicial de Duncan. Se entrenaron ratas en 
un hábito de evitación activa, a la tasa de un ensayo diario durante 18 días. El en- 
sayo comenzaba al colocar al animal en el lado “peligroso*” de una caja de dos 
compartimientos. Si en 10 segundos no pasaba al compartimiento ““seguro'”, se le 
aplicaba una descarga eléctrica en las patas hasta que lo hacía. Después de haber 
pasado al lado seguro, la rata recibía una DEC. La demora entre la respuesta y la 
DEC variaba para diferentes animales, y era de 20, 40 o 60 segundos, 4 0 15 mi- 
nutos, o 1, 4 o 14 horas, El tratamiento con DEC se administraba a continuación de 
cada uno de los ensayos de entrenamiento. Un grupo de sujetos de control no 
recibía DEC. El efecto de la demora entre la respuesta y la DEC se describe en la 
figura 14.6, que muestra el número promedio de respuestas de evitación durante 
los 18 ensayos para animales a los que se les daba la DEC después de cada magni- 
tud de demora. El logaritmo de la demora antes de la DEC se traza en la abscisa. 
En la figura 14,6 se muestra un efecto retrógrado acentuado de la DEC sobre el apren- 
dizaje. En el intervalo más corto, de 20 segundos, se produce muy poco aprendi- 
zaje. A medida que se alarga el tiempo antes de la DEC, ocurre menos decremento. 
Con una demora en la DEC de una hora o más, los sujetos que reciben DEC 
tienen una ejecución tan eficiente como los controles que no lo reciben. 
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Estos resultados pueden interpretarse en el sentido de que reflejan un proceso 
de consolidación de la memoria que tiene lugar en un periodo de alrededor de 60 
minutos a-continuación de cada ensayo de aprendizaje. Se supone que el DEC in- 
terrumpe este proceso, y que la cantidad que se aprende por ensayo aumenta con 
el tiempo de consolidación antes de que el DEC suspenda el proceso. 

Desgraciadamente, una hipótesis alternativa también explicaría los resultados 
de Duncan, es decir, el gradiente de la demora del castigo. Podríamos presuponer 
que el DEC es aversivo, de modo que castiga e mhibe las respuestas poco des- 
pués de las cuales se presenta; lo hace de acuerdo con un gradiente usual de 
demora. Esto explicaría los resultados de Duncan sin necesidad de recucrir a la hi- 
pótesis de consolidación. 

Experimentos ulteriores han demostrado que una serie de choques elec- 
troconvulsivos comienza a actuar como un evento aversivo a evitar; sin embargo, 
hay relativamente paca aversión evidente después de un solo DEC. Por esta y 
otras razones, se cree que el mejor paradigma para mostrar los efectos amnésicos 
del DEC es una situación de “aprendizaje de un solo ensayo'”, dentro de la cual 
se introduce un solo DEC. 

Un arreglo que se emplea en la actualidad y que cumple con estos requisitos es 
una situación de evitación pasiva, Se coloca una rata o un ratón sobre una platafor- 
ma ligeramente elevada encima de un piso enrejado. Si se trata de animales inge- 
nuos, bajarán de la plataforma en pocos segundos. Si al tocar el piso enrejado reci- 
ben una descarga dolorosa, una prueba posterior demostrará que se niegan a bajar 
de la plataforma: han aprendido una respuesta de evitación pasiva en un solo ensa- 
yo. Sin embargo, los animales que reciben un DEC poco después de la descarga 
parecen “olvidarlo”, de modo que en la prueba del día siguiente bajarán rápida- 
mente de la plataforma (Chorover y Schiller, 1965). De nuevo se obtiene un efec- 
to de amnesia graduada, aunque las constantes temporales parecen menores que 
las presentadas por Duncan. 

Por ejemplo, Chorover y Schiller informan que prácticamente no hay amnesia 
provocada por el DEC cuando éste sufre una demora de 30 segundos después 
del ensayo de aprendizaje; las demoras menores (de 0.5, 2, 5, 10 segundos) 
tienen efectos amnésicos más severos. En McGaugh y Herz (1972) pueden 
encontrarse reseñas de estos temas. 

En la actualidad se ha observado reiteradas veces el efecto retrógrado del DEC. 
Se consiguieron efectos amnésicos similares con drogas convulsivas, narcosis por 
calor, hiperoxia, y ciertas drogas anestésicas que producen inconsciencia o con- 
vulsiones. Durante los últimos treinta años, los desarrollos han seguido tres líneas 
primordiales. Primero, el efecto amnésico retrógado se ha estudiado concienzuda- 
mente para generar un conocimiento empírico más profundo del fenómeno; en 
particular, varias de las facetas recientemente descubiertas de la amnesia 
retrógrada son difíciles de explicar a la tuz de la teoría original de la consolidación. 
Segundo, se han ofrecido varias hipótesis alternativas para explicar el efecto am- 
nésico del DEC, y éstas a menudo conducen a experimentos que intentan diferen- 
ciar las nuevas hipótesis de la antigua acerca de la consolidación de la memoria. 
Tercero, la búsqueda de estructuras neurológicas contempladas en el efecto am- 
nésico ha avanzado a los detalles más finos y a un conocimiento más discriminativo 
de los eventos cerebrales que perturban la consolidación. Mencionaremos algunos 
resultados de cada tipo. 
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Dificultades pere da teoría de la consolidación 

Los estudios empíricos descubrieron varios fenómenos en la situación DEC que 
crean dificultades a una teoría simple de la consolidación. Porun lado, hay frecuen- 
tes informes de amnesia inducida por DEC, que “*desaparece espontáneamente” 
con el tiempo después del evento de aprendizaje de un ensayo seguido por el 
DEC. Pero si el DEC inmediato ha impedido cualquier aprendizaje, entonces no 
habrá ningún hábito que recobrar en el curso del tiempo. Sin embargo, tal recupe- 
ración no siempre se logra; las variables pertinentes que la determinan son la es- 
perie (las ratas se recuperan con más frecuencia que los ratones) y, en la situación 
de evitación pasiva, la severidad de la descarga inicial en una pata y el grado de in- 
tensidad DEC. 

Un segundo hecho embarazoso es que los diferentes índices de recuerdo des- 
pués del DEC no siempre concuerdan. Por ejemplo, un animal que recibe una 
descarga en las patas seguida por el DEC al otro día, quizá baje de la plataforma 
con facilidad, en apariencia mostrando amnesia para el choque y, sin embargo, su 
ritmo Cardiaco se acelerará en la situación de prueba, lo cual indica alguna aso- 
ciación de temor a esa situación (Hines y Paolino, 1970). Si el animal recibe des- 
cargas en las patas y DEC por bajar de la plataforma hacia el lado blanco —en vez 
de dirigirse al oscuro— de un piso de dos compartimientos, al día siguiente puede 
bajar con rapidez, mostrando amnesia para la descarga en las patas. Pero de todas 
formas preferirá bajar por el lado del color que implica no descarga, aparentemen- 
te porque recuerda dónde recibió el choque doloroso el día anterior (Carew, 
1970). Estas cuestiones tal vez podrían manejarse al suponer que el aprendizaje 
que conlleva respuestas autónomas se consolida con mayor rapidez que aquel que 
implica respuestas instrumentales, aunque claramente esto es ad hoc y des- 
agradable. 

Un tercer hecho en contra de la hipótesis de que el DEC perturba la consolida- 
ción es que la memoria de la respuesta al parecer permanece durante unas cuantas 
horas después del DEC, para desaparecer 24 horas después: este intervalo de 
prueba es el que generalmente se usa en tales estudios (Geller y Jarvik, 1968; 
McGaugh y Landfiekd, 1970). Los resultados son paradójicos para una teoría 
simple de Ja consolidación, la cual supondría que el DEC produce olvido total de 
modo inmediato y permanente. Quizá sea justo decir que el DEC sólo acelera la 
tasa de olvido en vez de causar la pérdida inmediata de la experiencia. 


Teorías rivates de los efectos DEC 

Como hemos dicho, otra línea de investigación proviene de la comprobación de 
teorías alternativas de los efectos inducidos por el DEC, Una teoría inicial pro- 
puesta por Lewis y Maher (1965) era que el DEC debería considerarse como un 
estímulo incondicionado que provoca inhibición inconsciente y generalizada, que 
se condiciona de modo pavloviano a los indicios de la situación pareados con el 
DEC. Aunque esta interpretación condujo a una serie de interesantes experimen- 
tos (que se reseñan en Lewis y Maher, 1965, y en Lewis, 1969), en términos ge- 
nerales no se ha aceptado, ya que no explica aquellos casos de evitación pasiva 
donde el DEC produce olvido, que se infiere del hecho de que el animal hace actí- 
vamente algo; es decir, baja al piso en el que el día anterior ha recibido una descar- 
ga dolorosa, en vez de refugiarse pasivamente en el reborde donde se le coloca 
como animal de control que sólo recibe descargas en las patas. Una teoría de la 
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inhibición condicionada no esperaría que los efectos DEC se revelaran en los ani- 
males . 1 ejecución activa. 

Una perspectiva más reciente e interesante de los efectos del DEC o de 
traumas cerebrales similares es que éstos pueden implicar dificultades de recupe- 
ración en vez de dificultades de aprendizaje (véase Bower, 1972d, págs. 117 a 
120; DeVietti y Larson, 1971; Lewis, 1969; Nielson, 1968). Posiblemente el 
DEC que sigue a un evento de aprendizaje hace que la memoria de esa experien- 
cia se reprima, de modo parecido a como se postula en la teoría freudiana de la 
represión. Tales recuerdos sólo podrían evocarse o evaluarse después en circuns- 
tancias especiales. El experimento de Misanin, Miller y Lewis (1968) sugiere es- 
te análisis, El evento crítico de aprendizaje era el pareamiento de un tono (sonido) 
con una descarga dolorosa en las patas de las ratas. Al día siguiente, se presentaba 
al grupo de ratas el tono seguido del DEC. Esta experiencia demorada de tono- 
DEC parecía interferir con la memoria del evento anterior de tono-descarga (a pe- 
sar de su '“tiempo de consolidación'* de 24 horas), pues al día siguiente el tono no 
despertaba mucho temor, como se medía por su supresión del acto de beber. La 
idea es que durante el tratamiento del segundo día, al principio el tono reinstaura- 
ba la memoria del par tono-descarga; sin embargo, el DEC a continuación de la re- 
cuperación de la memoria tono-descarga supuestamente hacía que algo como la 
represión o la inhibición se vinculara con esa memoria, de tal modo que blaqueaba 
su subsecuente recuperación para el estímulo del tono. Hay varios otros resulta 
dos que sugieren que el DEC perturba la recuperación, así como el almacena- 
miento de una memoria para un evento contiguo a un DEC (véase Miller y Sprin- 
ger, 1973). 


Correlaciones cerebrales de los eventos amnésicos 

Otra línea de investigación acerca de la amnesia se refiere al trazado de mapas 
exactos de los eventos cerebrales cruciales que perturban la consolidación de la 
memoria. Algunos de estos estudios buscan especificar con mayor precisión la re- 
acción crítica de un componente cerebral al DEC o a los anestésicos que es res- 
ponsable de la producción de efectos amnésicos de diferente grado. Por ejemplo, 
los resultados de Landfield y McGaugh (1972), y de Landfield y sus colaboradores 
(1972) sugieren que el grado de amnesia inducida por DEC en las ratas se correla- 
ciona con la longitud del tempo durante la cual las ondas theta están ausentes en el 
hipocampo a continuación del DEC. Se encontró muy poca o ninguna armesia en 
las ratas para las cuales la actividad theta regresaba con rapidez después del DEC. 
Otro tipo de investigación intenta interferir con la consolidación de la memoria me- 
diante la aplicación de estimulación eléctrica discreta y localizada a centros ce- 
rebrales específicos, por medio de electrodos implantados. Se ha descubierto tuna 
variedad de centros cerebrales en los cuales los impulsos eléctricos aislados apli- 
cados poco después de un evento de aprendizaje impiden la consolidación de la 
memoria. Tal estimulación puede ser débil y breve, pero selectivamente destruc- 
tiva en contraste con la “'impresionante'* devastación causada por un DEC seve- 
ro. La interferencia con el aprendizaje se ha producido mediante la estimulación 
eléctrica discreta al hipocampo dorsal, el putamen caudado y la corteza frontal, 
entre otros centros, mientras que la facilitación en el aprendizaje se logró a partir 
de la estimulación posensayo en la formación reticular mesencefálica y el hipocam- 
po ventral, entre otros lugares (véase McGaugh y Herz, 1972, para una reseña). 
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En la actualidad, la investigación no es particularmente esclarecedora, ya que po- 
cos experimentos demuestran gradientes temporales de efectos, como lo requiere 
la hipótesis de la consolidación. Además, los estudios por lo general usan ensayos 
masivos, de modo que los efectos de la estimulación posensayo no pueden sepa- 
rarse con facilidad. Así, por ejemplo, un tipo particular de choque cerebral tal vez 
no impida el aprendizaje; más bien, sus persistentes efectos secundarios pueden 
perturbar la discriminación sensorial, de modo que el animal se desempeñe mal en 
los ensayos que siguen a la estimulación. Un análisis psicológico de los efectos de 
tales estímulos cerebrales rastrea de esta forma algunas de las estructuras críticas 
que sirven a la consolidación de la memoria, pero es probable que la tarea sea lar- 
ga, lenta, y quizá un proceso indefinido. 


Variables que afectan la tasa de consolidación 


Según la hipótesis de un almacén de memoria de corto y de largo plazo, la entra- 
da de estimulación supuestamente produce una actividad neural “'reverberante””, 
representativa de esa experiencia, que persiste durante un tiempo. Esta huela 
neural dinámica coincide con nuestra MCP. Mientras dura esta actividad reverbe- 
rante, el cambio estructural permanente que sustenta a la MLP se desarrolla con 
lentitud. Una vez que la huella reverberante desaparece, el cambio estructural se 
detiene y permanece en el nivel alcanzado. En esta teoría, es plausible buscar las 
vañables que influyen en la tasa de reverberación o sobre el tiempo que trans- 
curre antes de que desaparezca la huella de corto plazo, pues éstas pueden afectar 
la proporción en que un ensayo de aprendizaje se consolidará como MLP. 

McGaugh (1965, 1968) ha investigado dos clases generales de variables que 
pueden interpretarse con estos medios: las drogas y la constitución genética de 
los animales. En una serie de experimentos, demuestra que ciertas drogas que 
estimulan al SNC, como la estricnina, el diazamantano, anfetaminas y picrotoxina, 
administradas en pequeñas dosis, aceleran el aprendizaje de laberinto de las ratas 
cuando se les inyecta ya sea antes o después del ensayo de cada día. En la actuali- 
dad, esos resultados se han aplicado en muchas ocasiones a diversas tareas de 
aprendizaje (McGaugh y Herz, 1972). Por ejemplo, Davis y sus asociados (1978) 
descubrieron que seres humanos adultos a los que previamente se había inyectado 
fsostigmina (una droga que incrementa la acetilcolina en las sinapsis) efectuaban el 
recuerdo libre de una lista de palabras con mayar rapidez que los sujetos de 
control, que recibían una inyección salina neutral. Se supone que estos estimulan- 
tes incrementan la tasa de consolidación o prolongan la huella de actividad de corto 
plazo, lo cual da lugar a un aprendizaje más consolidado por ensayo. Por ejemplo, 
un resultado estándar es que las inyecciones posteriores al ensayo facilitan el 
aprendizaje sólo si se administran dentro de aproximadamente 15 minutos des- 
pués de la experiencia de aprendizaje del día. 

En otra línea de trabajo, McGaugh usó descendencias genéticas de ratas que 
Tryon (1942) había criado selectivamente para que fueran listas o tontas en el 
aprendizaje de varios problemas de laberinto. Comprobó las implicaciones de la 
idea de que las descendientes listas y tontas en el laberinto diferían en sus tasas o 
tiempos de reverberación neural. Por ejemplo, confirmó que en una situación 
DEC de aprendizaje de un solo ensayo, el DEC puede demorarse más tiempo y 
no obstante producir mayores déficit de memoria en las ratas tontas. Asimismo, 
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cuando los ensayos en el laberinto se hacen muy espaciados, las ratas tontas 
aprenden tan rápido como las listas, y la diferencia sólo aparece en los ensayos 
masivos. Esto es comprensible si se presupone que las ratas tontas consolidan 
con mayor lentitud, y que la consolidación del aprendizaje del ensayo n se in- 
terrumpe cuando comienza el ensayo 2 + 1 en la condición de ensayos masivos. 
Además, se encontró que la inyección del estimulante nervioso llamado picrotoxi- 
na facilitaba el aprendizaje, por ensayos masivos, de las ratas tontas (de hecho, las 
hacía aprender tan rápido como las ratas listas), mientras que en estos últimos ani- 
males sólo se facilitó al administrar dosis más elevadas de la droga. Al parecer, es- 
tas y otras observaciones son compatibles con el punto de vista de que dos des- 
cendencias genéticas difieren en la tasa de consolidación de la memoria. 

Es conveniente notar que la distinción entre memoria de largo y de corto plazo 
antes usada emplea un sistema nervioso “conceptual” con ventaja, sin especificar 
los circuitos neurales implicados. Sin embargo, hay pruebas convincentes de la 
existencia de circuitos neurales reverberantes persistentes en la corteza. Por 
ejemplo, Burns (1958) informó que algunas descargas eléctricas aplicadas a una 
parte aislada de la corteza inactiva producen explosiones de actividad nerviosa que 
persisten por varios minutos (a veces hasta media hora) después de que la estimu- 
lación ha cesado. Pero en realidad se sabe poco acerca de estos efectos persisten- 
tes que se producen en tejidos no aislados. Tampoco se conoce mucho en torno 
del efecto que tienen en el cerebro las drogas como la picrotoxina, que facilita el 
aprendizaje, y apenas comenzamos a acumular hechos relacionados con el efecto 
neurológico del DEC sobre el metabolismo y el funcionamiento general del ce- 
rebro, El objetivo de señalar esta circunstancia es que las principales —y tal vez 
las únicas— pruebas que apoyan a la hipótesis de la consolidación derivan de los 
estudios “*conductuales””, y no de la observación de los procesos en el sistema 
nervioso central. 

Aunque la hipótesis de la consolidación ha probado ser viable. los experimentos 
deberán formular y contestar varias preguntas más, ¿Qué causa las diferencias en 
el tiempo requerido para consolidar diferentes tareas de aprendizaje? ¿El cambio 
es gradual, de todo o nada, o gradual con un umbral? ¿Cómo distinguiremos si se 
trata de un mal almacenamiento o de un acceso deficiente al engrama almacenado? 
¿Cuál es la naturaleza genérica de los fenómenos que perturban la consolidación? 
En estos términos, ¿cómo se explicarían los efectos de la interferencia proactiva 
sobre la retención? ¿Cómo pueden los animales aprender a eludir un lugar donde 
se administró un DEC, si ese DEC evita el almacenamiento de las memorias des- 
agradables? ¿Se detiene la consolidación cuando desaparece la huella de corto pla- 
zo, o prosigue si no se interfiere? ¿Cómo explicamos la recuperación de largo plazo 
de una memoria perturbada por el DEC? ¿Cuáles son los eventos neurales que se 
facilitan cuando las inyecciones de drogas posensayo incrementan el aprendizaje? 
Éstas y otras interrogantes siguen en pie, y la investigación habrá de contestarlas 
en detalle. 


Pacientes neurológicos 


Mediante la estimulación eléctrica y la ablación selectiva se han obtenido algu- 
nos resultados amnésicos muy sorprendentes en el caso de pacientes humanos 
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que se someten a la cirugía cerebral por razones médicas (generalmente para la 
extirpación de focos epileptogénicos que causan ataques frecuentes). Bicktord y 
colaboradores (1958), y Chapman y sus asociados (1967) han informado que la 
estimulación eléctrica del lóbula temporal del cerebro del paciente despierto (du- 
rante cirugía bajo anestesia local) produce una amnesia retrógrada temporal. El 
paciente puede ser incapaz de recuperar eventos de hasta dos semanas atrás, y la 
longitud de esta laguna de memoria aumenta con la duración de la estimulación. 
Sin embargo, ja amnesia es tempora) y la memoria se recupera por completo unas 
cuantas horas después de la estimulación. Mientras ésta estuvo presente, los pa- 
cientes eran incapaces de recuperar memorias de varias horas o días atrás, tenían 
una ejecución muy aceptable en tareas de memoria de corto plazo o inmediata, 
como la repetición de una breve serie de dígitos. Estos inquietantes resultados 
deberían investigarse con estudios de seguimiento, pero requieren de la cooperación 
de cirujanos del cerebro que permitan la experimentación durante la intervención 
quirúrgica. 

El papel crítico del hipocampo en la consolidación de la memoria ha sida sugerido 
por las sorprendentes incapacidades de los pacientes que sufrieron lesión o abla- 
ción bilateral (en ambos lados de la línea media). Aunque al parecer tales pacientes 
tienen una memoria normal de corta plazo o inmediata, y pueden recordar con 
cierta deficiencia su vida antes de la lesión cerebral, se muestran incapaces de re- 
tener información nueva y compleja por un largo tiempo (Milner, 1966). Por 
ejemplo, un paciente así no puede recordar a una persona que conoció y con la cual 
estuvo conversando apenas unos minutos antes. Se presentará a sí mismo repeti- 
das veces y formulará las mismas preguntas que en ocasiones anteriores, con una 
confianza total de que se trata del primer encuentro. Desde luego, estos pacientes 
suelen estar muy desorientados acerca de dónde se encuentran (en el hospital), 
cuánto tiempo han permanecido allí, cómo llegaron, o qué les ha sucedido, a ellos o 
al mundo, desde su trama cerebral (Talland, 1965). Para ellos, el tiempo trans- 
currido y los eventos que ocurmeron en ese lapso no existen; independientemente 
de cuánto tiempo haya pasado desde que llegaron al hospítal, en su memoria 
siempre es “ayer”. 

Este trágico sindrome en ciertos aspectos concuerda con la hipótesis de le me- 
moria dual, que propone una MCP y una MLP. Cabría suponer que en estos pa- 
cientes el mecanismo que transfiere las representaciones de la experiencia a la 
MLP ha sido prresto fuera de funcionamiento, aunque su MCP está intacta, al 
igual que las memorias de Jargo plazo que tenían preoperativaraente. Pero esto no 
es todo. Miner (1970) descubrió que sus pacientes con lesiones en el hipocampo 
podían aprender y retener ana habilidad sensoriomotora (dibujos del modelo inverso), 
y aprendían a identificar cuadros completos de objetos comunes cuando se les 
mostraban fragmentos lineales mínimos de los mismos. Él paciente revelaba me- 
moria al mejorar en ejecuciones repetidas de prueba, a pesar de su opinión de que 
una tarea dada era nueva y la emprendía por primera vez. En otros estudios se ha 
informado de esta llamativa habilidad de los pacientes armésicos para hablar acer- 
ca de lo que claramente han aprendido en una tarea no verba) (para una reseña, 
véase Carlson, 1977). Por ejemplo, los pacientes que sufrían del síndrome de 
Korsakoff (donde hay lesión en los cuerpos mamilares, con efectos semejantes a 
L Jesión bilateral del hipocampo) poseen la memoria suficiente como para selec- 
cionar de entre un conjunto aquellas fotografías que vieron 18 días antes, aun 
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cuando no tengan conocimiento de que habían visto anteriormente alguna de las 
fotografías o al propio experimentador. De este modo, aunque estos pacientes 
pueden almacenar en la MEP estímulos no verbales, está ausente su sensación 
consciente de conocer el material. Asimismo, son ineptos para recuperar material 
memorizado con indicios de otra modalidad; es como si la lesión en el hipocampo 
hubiera hecho a la memoria extraordinariamente literal y específica para el 
estímulo presentado. Debe señalarse que los indicios de otra modalidad eran ver- 
bales, y que estos pacientes muestran un verdadero déficit en el almacenamiento 
de mensajes verbales; pareciera que su sistema de significado para el lenguaje 
está muy perturbado. 

Warrington y Shallice (1972) han descrito otro tipo de pacientes con lesión ce- 
rebral que tienen una memoria muy defectuosa para las palabras presentadas audi- 
tivamente (un tramo auditivo de 1 a 2 dígitos), pero una memoria normal para las 
palabras presentadas de modo visual. (Cabe aclarar que su sentido de la audición 
es normal.) Tales resultados sugieren que las memorias se codifican y se almace- 
nan de acuerdo, en parte, con su modalidad sensorial, y que las lesiones cerebra- 
les pueden perturbar selectivamente las memorias de modalidades particulares, 


Una teoría de la amnesia 


Wickelgren (19795) propuso una interesante teoría para explicar el patrón de re- 
sultados de aprendizaje que muestran los pacientes hipocampectomizados, así 
como la amnesia anterógrada y retrógrada originada por tratamientos DEC. En 
primer término, Wickelgren distingue entre un tipo de nivel inferior de aprendizaje 
asociativo E-R y uno superior de aprendizaje de patrón configuracional que deno- 
mina *'formar bloques”? o aprendizaje cognoscitivo. (Es interesante señalar que 
Razran (1971) y Bitterman (1975) han observado que las especies inferiores, 
como los peces y los anfibios, sólo muestran condicionamiento de nivel inferior, 
mientras que el aprendizaje de patrón complejo o configuracional únicamente 
puede darse con facilidad en los pájaros y en animales más avanzados.) Wickelgren 
observa que los pacientes con lesión en el hipocampo muestran una dicotomía si- 
milar de habilidades de aprendizaje: aprenden hábitos simples £-R o elaboran aso- 
ciaciones ya existentes, pero no les es posible acceder a formas superiores de 
aprendizaje o a cogniciones acerca de ello. A partir de esta evidencia, Wickelgren 
supone que para que se forme una memoria compleja (haz de asociaciones), la 
activación difusa de un sistema de excitación hipocampal debe estar activa al mis- 
mo tiempo que las neuronas que codifican las características específicas del patrón 
de evento que ha de aprenderse. 

Las ideas básicas se muestran en la figura 14.7, donde los nodos simbolizan a las 
neuronas (o agrupaciones de neuronas) en la corteza de asociación que represen- 
tan características de estímulo, eventos, conceptos o ideas, los cuales se activan 
cuando aquellos estímulos están presentes o se piensa en ellos, Wickelgren tam- 
bién postula una gran agrupación de neuronas “libres'” de nivel superior que ini- 
cialmente no tienen conexiones fuertes, pero que poseen muchos eslabones débiles 
con un gran número de neuronas de nivel inferior. Cuando el patrón de estímulo 
está presente, sus componentes y sus relaciones estructurales, a, b, ese activan, 
y la activación desde ellas intersecta en algún punto de nivel superior en la corteza 
de asociación (aquí denotada X). Los grupos asociativos formados por tales aso- 
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camiones verticales se examinaron al final del capítulo 6. Wickelgren presupone 
que el hipocampo opera como un sistema de excitación (motivacional) que se pro- 
yecta difusamente a casi cualquier neurona libre de nivel superior. Si las caracterís- 
ticas de estímulo a, b, c, activan el nodo X al mismo tiempo que éste recibe excitación 
del hipocampo, comienza a crecer con lentitud un grupo asociativo permanente. 
Es decir, las vías que conectan las neuronas e, b, c con la neurona X incrementan 
su eficiencia o disminuyen su resistencia sináptica —la analogía de la fuerza de 
asociación. Así, el nodo X se liga o especifica por sus conexiones fuertes con las 
neuronas a, b, c. El nodo X sirve entonces como un nodo de bloque, y codifica la 
asociación contigua de características o eventos 2, b, e en el patrón aprendido. El 
nodo X' es la encarnación física del bloque, o memoria, y sirve básicamente como 
un dispositivo interruptor de la excitación. En particular, la presentación de la 
característica a podría originar que el nodo X de nivel superior disparara, con lo 
cual también lo harían las neuronas 5 y c para completar el patrón. La mayor parte 
del aprendizaje puede representarse- mediante esas estructuras asociativas 
simples. Para presentar un ejemplo, Tolman habría supuesto que los tres compo- 
nentes críticos de la figura 14.7 son el estímulo discriminativo, la respuesta y la 
consecuencia recompensante de un patrón de evento y que después del aprendi- 
zaje el estímulo discriminativo solo sería capaz de evocar la respuesta, así coma la 
anticipación de la recompensa esperada. 

Wickelgren supone que un proceso de consolidación se desarrolla durante algún 
tiempo después del evento de aprendizaje a, b, c. Las neuronas a-b-c permanecen 
activas y disparan la célula X en conjunción con los impulsos del hipocampo, todo 
ello en ciclos repetitivos. El bloque asociativo X se consolidará en caso de que se 
le impida entrar en los bloques de interferencia. (Recuérdese que un nodo de nivel 
superior puede recibir entrada débil de muchas neuronas de estímulo de nivel infe- 
rior.) Wickelgren postula que dentro de la teoría se impide este aprendizaje de in- 
terferencia debido a la gradual supresión del enlace desde el hipocampo hasta la 
célula X ligada. Es decir, durante la gradual ligazón de un bloque de nivel superior, 
inhibe y apaga el vínculo desde el hipocampo (véase el vínculo *“negativo'” desde 
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Figura 14.7. Diagrama hipotético de un patrón de estimulo de tres caracteristicas que 
se asocia con un nodo de bloque cortical que recibe “activación de aprendizaje” del 
sistema de activación reticular 
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el nodo X en la figura 14.7); por lo tanto, la célula X se ““encierra'* para a, b, cy no 
puede participar en otros bloques asociativos. Para excitar después de la huella de 
memoria, Wickelgren presupone que las células reciben activación no específica 
desde algún otro sistema, como el sistema de activación reticular, que se suma a 
la excitación sensorial desde un indicio de recuperación a, bo c. 

La teoría de Wickelgren explica el patrón de los éxitos y fracasos del aprendizaje 
de pacientes con lesiones en el hipocampo, ya que éstas destruyen el vínculo de 
activación crítica necesario para formar los bloques de nivel superior requeridos 
para el aprendizaje complejo o cognoscitivo. Aunque tales pacientes muestran me- 
moria de largo plazo y cierta memoría de corto plazo (es decir, activación temporal 
de las neuronas de evento de nivel inferior como q a b), no pueden aprender 
nuevas memorias complejas debido a la ausencia del ““impulso de aprendizaje” del 
hipocampo. Mediante una línea similar de razonamiento, la teoría explica la amne- 
sia anterógrada temporal que sigue a un choque o DEC. En el transcurso del esta- 
do inconsciente y durante un tiempo después, el hipocampo ha sido puesto fuera 
de funcionamiento, de mado que en ese lapso no puede producirse ningún aprendi- 
zaje complejo nuevo. A medida que los efectos de la convulsión desaparecen, se 
recupera el vínculo de aprendizaje del hipocampo y también la habilidad de apren- 
der del sujeto. Asimismo, la teoría explica la anmesia retrógrada para los eventos 
cercanos en el tiempo al DEC, ya que al detener la excitación hipocampal, alimen: 
tada a las células X de nivel superior, el DEC suspende la consolidación de la me- 
moria para aquellos eventos anteriores. La cantidad de consolidación habría sido 
mayor mientras más tiempo hubiese transcurrido entre el evento que debía apren- 
derse y el DEC. 

También hay abundante bibliografía acerca de la influencia de las lesiones en el 
hipocampo en el aprendizaje de los animales inferiores, usualmente ratas (véanse 
las reseñas de Hirsh, 1974; [saacson, 1974). Los resultados se describen ade- 
cuadamente mediante la generalización de que las lesiones o perturbaciones hipo- 
campales intervienen con el aprendizaje y la consolidación de hábitos configura- 
cionales complejos, pero no con los hábitos simples de bajo nivel. La teoría de 
Wickelgren parece explicar todos estos fenómenos de una manera clara, de modo 
que su evaluación detallada se ha convertido en un tema importante en la agenda 
de investigación. Debe notarse que esta teoría usa en gran parte un sistema ner- 
vioso conceptual y, aunque las premisas son congruentes con los resultados fi- 
siológicos, su validación se basa por completo en observaciones conductuales. 


CAMBIOS FISIOLÓGICOS EN EL APRENDIZAJE 


Hasta el momento nos hemos dedicado a la neurofisiología del aprendizaje, y de- 
jamos a un lado lo que sin duda es el tema central: la naturaleza del cambio fisioló- 
gico que tiene lugar durante el aprendizaje. La razón de evitar este problema es 
simple: la naturaleza de ese cambio está muy lejos de conocerse. En el transcurso 
de los años se han ofrecido varias hipótesis especulativas, pero la evidencia para 
cualquiera de ellas es muy limitada, e incluso hay poco consenso acerca de cuáles 
son las direcciones más prometedoras. Tal como están, las hipótesis varían en su 
grado de elaboración, desde “'indicaciones'” de una línea hasta sistemas más ela- 
borados de postulados; pero en ningún caso se ha demostrado que la hipótesis 
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ee para explicar una gama sustancial de los hechos conocidos acerca del apren- 
aje. 

Este es un lamentable estado de cosas, que al parecer es consecuencia de la 
dificuitad del problema. Indudablemente, no puede achacarse a la (alta de labo- 
tiosidad o de mgenio por parte de los investigadores que trabajan en el campo. En 
esta sección nos referiremos brevemente a la diversidad de hechos e ideas que son 
pertinentes al almacenamiento de información en el sistema nervioso, y también 
se mencionarán algunas de las anteriores ideas dominantes acerca del cambio 
sico en el aprendizaje, no tanto para señalar la evidencia que las apoya Sino para 


destacar su ausencia. . L A ' 
Comenzaremos con un ejemplo del reflejo condicionado de Pavlov. A conci- 


nuación de la habituación, el condicionamiento clásico es casi el contexto más 
simple en el que se sitúan varias nociones acerca del cambio físico originado por el 
aprendizaje. na campana (£C) se parea repetidas veces con una descarga 
eléctrica (EJ) que se administra a un perro en la pata delantera, produciendo una 
flexión de la extremidad (RP) hasta que, con el entrenamiento, la campana por sí 
sola produce la respuesta (RC). Si se observa el proceso desde el ángulo anatómú- 
co, se advierte que intervienen al menos tres clases de estructuras o poblaciones 
celulares: 1. células que se encuentran a todo lo largo del canal de entrada excitá- 
de por el EC; 2. células a Jo largo del canal de entrada sensorial excitado por el El; 
y 3. células a lo largo del canal de salida motor que inicia y controla la respuesta 
(RD. A estas estructuras múltiples se les denomina sitios o centros del EC, del 
El y de la K/. Debido a las conexiones innatas, existe ya una fuerte tendencia a 
que se active el centro del El para producir la activación del centro de la R7. La 
mayor parte de las teorías neurofisiológicas del condicionamiento emplea una u 
otra versión modificada de la idea de sustitución del condicionamiento. En virtud 
de múltiples asociaciones contiguas de la actividad que se produce en el centro del 
EC y en el centro de El (o de la RT), el primero queda conectado de alguna mane- 
ra con el segundo, de modo que ahora la activación del EC transmite excitación 
efectiva al centro del El (o de la RP). Por lo tanta, el EC por sí solo ¿mita o susti- 
tuye en cierto grado la acción del Ef. Así, se proponen varias hipótesis acerca de 
la naturaleza de esta conexión funcional y de los procesos de su formación. 

Una clase de hipótesis se reflere al aumento selectivo de la eficiencia en las vías 
neurales existentes que conectan los centros EC y El que, como puede suponer- 
se, implican muchas sinapsis centrales unidas en cadena. Si hay una buena conduc- 
ción entre los centros EC y El, es posible que el £C pueda activar el centro El y 
provocar así una RC anticipatoria, En este caso, se supone que existe algún cam- 
bio anatómico o bioquímico en las sinapsis que se encuentran a lo largo de estas 
vías fundamentales. Hay ciertas posibilidades de que las terminaciones presinápti- 
cas del axón aumenten de tamaño, incrementen su longitud o multipliquen su nú- 
mero para lograr un mejor contacto con la neurona postsináptica, o que la cétula 
postsináptica altere su naturaleza bioquímica para ser selectivamente sensible a un 
transmisor particular, lo cual ayuda a la futura transmisión a través de la sinapsis. 
No hay mucha certeza en tomo a cualquiera de estos mecanismos específicos en 
el aprendizaje. Un problema es que la estimulación normal que pasa a través de la 
sinapsis no cambia su eficiencia (Brink, 1951). Esta puede mejorarse —por lo ge- 
neral sólo por periodos breves (unos cuantos minutos)— si la sinapsis es bombar- 
deada por una descarga de impulsos de alta frecuencia (400 impulsos por 
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segundo), pero no se sabe qué importancia tenga este resultado particular para el 
aprendizaje normal. 

Una idea alternativa propuesta por Pavlov y que ha sido investigada por los ru- 
sos, es la de la irradiación cortical de los campos eléctricos extraneuronales. Se su- 
pone que al ser activados, los sitios corticales del EC y el Ef irradian excitación 
eléctrica que se difunde en todas direcciones con intensidad decreciente. Se cree 
que como la excitación del EC es la más débil de las dos se leva hacia el centro de 
excitación del El de modo no especificado. En consecuencia, se establecería una 
especie de vía cortical (no especificada) entre el centro del EC y el del El. Beritotí 
(citado en Konorski, 1948) elabora más la hipótesis. Sin embargo, en esta concep- 
ción de los campos eléctricos intracorticales que se difunden, hay dos problemas 
importantes. Primero, se sabe que los animales (los perros) aprenden reflejos con- 
dicionados simples aun después de que se les ha extraído la corteza por completo. 
Segundo, en un experimento de Sperry y Miner (1955) se demostró que el aprer- 
dizaje no se perturbaba en esencia en animales cuyas cortezas se habían alterado 
mediante cortes transversales de cuchillo o con la implantación de alambres y ho- 
jas de mica que sirven como conductores y aisladores, respectivamente. Estos 
aditamentos deberían haber perturbado o deformado a cualquiera de los campos 
eléctricos generados o ya existentes en la corteza. Pero no interfirieron de ningún 
modo con el aprendizaje de las RC muy complicadas. 

Como hemos visto al hablar de la consolidación, se ha propuesto que una se- 
cuencia de entradas de estímulo establece una huella (memoria) de actividad de 
corto plazo, que se basa en circuitos neuronales reverberantes que implican ele- 
mentos excitados por las entradas EC y El. La neurona A excita a la neutona B, 
la cual, por una vía más o menos directa, excita de nuevo a la A; por lo tanto, se 
presume que el circuito cerrado de la actividad de A a B y a A persiste tiempo des- 
pués de las entradas. Esta actividad reverherante persistente supuestamente ín- 
dice un cambio estructural más duradero (de naturaleza desconocida), de modo 
que los centros nerviosos de A y de B se excitarán al unísono. La apreciación más 
justa que puede hacerse acerca de esta idea es que no se ha brindado ninguna 
prueba convincente de la existencia de circuitos reverherantes en el cerebro in- 
tacto que intervengan claramente en el aprendizaje o que duren lo suficiente como 
para tener.las propiedades que se les atribuyen. Como se ha dicho, Burns (1958) 
informó de una actividad neural muy persistente después de la estimulación de la 
corteza, la cual sucedía en una parte aislada de material que no estaba sujeta a las 
fuerzas desintegradoras provenientes de otras áreas del cerebro. En cualquier 
caso, la idea de la reverberación, incluso si es verdadera, no nos dice nada acerca 
de la naturaleza del cambio introducido por el aprendizaje. 


Preparaciones del modelo 


En vez de especular acerca de los cambios neurales que se producen en el 
aprendizaje de la RC, muchos investigadores preferen buscar preparaciones ex- 
perimentales en las cuales unas cuantas neuronas modifiquen su conducta de 
modo semejante a la del aprendizaje. Se espera que al estudiar una forma primitiva 
de almacenamiento de la información o del aprendizaje a nivel de la célula nerviosa 
simple, podamos llegar a algunas hipótesis fructíferas acerca de los cambios físicos 
que tienen lugar durante ese proceso. De acuerdo con esta perspectiva, se han 
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hecho muchos esfuerzos para desarrollar preparaciones que muestren el aprendi- 
zaje simple en unas cuantas neuronas. Á continuación examinaremos dos de esas 
preparaciones. 


Epilepsia de foco de espejo 

La primera preparación es el fenómeno epileptiforme del foco de espejo, donde un 
grupo de células cerebrales normales aprende a comportarse de un modo anor- 
mal. Se ha observado que un grupo de células cerebrales que descarga de manera 
anormal en la corteza de un hemisferio cerebral (el foco primario) dispara una car- 
ga semejante hacia una zona correspondiente del otru hemisferio (el foco secunda- 
ño). Es probable que los principales vínculos que conectan a ambos focos pasen 
por el cuerpo calloso. El foco primario puede producirse al aplicar varias sustan- 
cias químicas (cloruro de etilo v hidróxido de aluminio) en el área cerebral, o por 
medio de una lesión o de un tumor (como sucede en la epilepsia). Inicialmente, la 
descarga del foco secundario depende de la descarga del foco primario. Sin embar- 
go, después de cierto tiempo (en el mono, alrededor de 8 semanas), el foco secun- 
dario comienza a descargar de modo anormal por sí solo, independientemente del 
foco primario. Ahora éste puede extirparse y el foco secundario continuará con su 
patrón de descarga en paroxismo: ha “aprendido”? a descargar de modo anormal. 
Además, si se aísla neuronalmente al foco secundario separándolo del tejido cir- 
cundante (pero sin alterar su irrigación sanguínea) y se le deja en estado inactivo 
durante algunos meses, al estimular después el tejido se seguirá produciendo el 
patrón de descarga anormal. Parece ser que esa porción de tejido ha ““retenido”” 
este patrón de descarga después de meses de inactividad. La importancia de esta 
preparación es que el aprendizaje de un tipo primitivo se ha demostrado en un gru- 
po relativamente pequeño de células corticales. 


Habituación de los reflejos simples 

Entre las preparaciones modelo que se proponen como ideales para estudiar los 
procesos del aprendizaje, debemos mencionar otras tres debido a su esencial sen- 
cillez. Una de ellas es la habituación de un reflejo de flexión en un animal. Los 
ejemplos usuales son la flexión de la pata trasera de un gato con la espina dorsal 
seccionada (véase Thompson y Spence, 1966), el movimiento de la aleta caudal 
del cangrejo (Wine y Krasne, 1977) o el reflejo de repliegue de las agallas del mo- 
lusco Aplysia (Kandel y Spencer, 1968). Estos son reflejos neuronales particular- 
mente simples, que implican una neurona sensorial de la piel, una neurona motora 
para el músculo registrado, y ninguna, una, o como máximo dos interneuronas (y 
conexiones simápticas). Dada su sencillez, se argumenta que tales preparaciones 
son ideales para estudios electrofisiológicos y bioquímicos detallados de los fenó- 
menos del aprendizaje. La habituación, sin duda una de las formas más simples de 
aprendizaje (es comparable al "reconocimiento de estímulo** en los seres huma- 
nous), sigue en la mayor parte de los casos estas nueve leyes empíricas (adaptadas 
de Thompson y Spencer, 1966, págs. 18-19): 


1. La aplicación repetida de un estímulo da lugar al progresivo decremento de la respues- 
ta usual que provoca. Esto se denomina habituación. 

2, La respuesta se recupera espontáneamente en el transcurso del tiempo sin el estímulo. 

3, Cuando la serie de habituación y los interalos de recuperación se repiten, la habituación 
avanza cada vez más rápido. 
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4. Por lo general, cuanto más elevada sea la tasa de estimulación, más rápida y extensa 
será la habituación. 

5. Mientras más débil sea el estímulo, más rápido se producirá la habituación a él. Es po- 
sible que los estímulos muy intensos no se habitúen. 

6. Los efectos del entrenamiento de habituación pueden proceder más allá del nivel de 
respuesta '“cero'”; es decir, los ensayos adicionales de habituación que se dan des- 
pués de que la respuesta se ha detenido momentáneamente, de todos modos provaca- 
rán una recuperación más lenta de la habituación. 

7. La habituación de una respuesta para un estímulo dado extibe generalización a otros 
estímulos. 

8. Una respuesta de habituación puede recuperarse mediante la presentación momentá- 
nea de otro estímulo “*“sorpresivo'”* o fuerte. Este fenómeno se denomina deshabitua- 
ción. 

9. El uso reiterado del estímulo de deshabituación (véase el inciso 8) da como resultado 
que ese estímulo pierda su efecto de destrabituación. 


Estas nueve características sirven como definición operativa de la habituación. 
Una vez que se ha cumplido con varios de estos criterios mediante una prepara 
ción dada, podrán comenzarse a estudiar las correlaciones neurofisiológicas de la 
habituación en esa preparación. Por lo general, la habituación en las preparaciones 
polisinápticas (como la preparación espinal en los gatos) se correlaciona con una 
disminución en la transmisión mensurable con microelectrodos en las sinapsis in- 
termeuronales. En las preparaciones no sinápticas, como el reflejo del repliegue de 
las agallas de la aplysia, la habituación aparece en la transmisión atenuada de la ter- 
minal presináptica de la neurona sensorial estimulada. La deshabituación se produ- 
ce al estimular cualquier neurona sensorial en la cual se produce sinapsis en la snis- 
ma unidad motora. 

En el trabajo con la aplysia se ha usado el ganglio abdominal aislado, un grupo de 
grandes células nerviosas que consta de neuronas motoras, internenronas y célu- 
las neurosecretoras. Estas células median conductas tan diversas como el desove, 
el entintamiento (oscurecimiento del agua circundante) y el movimiento de las 
agallas. Unas cuantas células nerviosas gigantes pueden ser vistas con facilidad, 
estimularse y registrarse, Muestran habituación a un estímulo repetitivo. Tam- 
bién exhiben facibtación no especifica ('*sensibilización””) en el sentido de que el 
reiterado disparo de una célula mediante un estímulo fuerte ““sensibilizará” la cé- 
lula, de modo que uno débil (previamente ineficaz) que la alcance por medio de una 
sinapsis diferente disparará a la célula (Kandel y Tauc, 1965a, 19655). El periodo 
de excitabilidad acrecentada de la célula estimulada puede durar de 10 a 30 minu- 
tos. Este fenómeno particular no depende de un pareamiento temporal específico 
de estímulos débiles (EC) y fuertes (£7); el efecto es no específico. El que se ob- 
tenga o no facilitación verdaderamente específica y cuánta (que requiera parea- 
mientos EC-EJ) todavía es motivo de controversia. Kupfermana y Pinsker (1969) 
han presentado sistemáticamente plausibles modelos para el aprendizaje en el ni- 
vel sináptico aislado, con consideración especial de las pruebas obtenidas en los in- 
vertebrados. 

El problema con el estudio de los sustratos fisiológicos del aprendizaje o de 
otros fenómenos conductuales con preparaciones tan simples es que la generaliza 
ción de los resultados 2 organismos superiores y más complejos puede ser dificil. 
Para legitimar la generalización deben salvarse tres obstáculos, Primero, las pro- 
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piedades conductuales del aprendizaje en el sistema modelo deben corresponder a 
las que se encuentran en vertebrados más complejos e intactos. Segundo, los me- 
canismos neurales que sustentan el aprendizaje en el sistema modelo han de ser lo 
bastante simples como para permitir un minucioso análisis, Tercero, los mecanismos 
neurales que sirven al aprendizaje en el sistema modelo también deben demos- 
trarse para el aprendizaje en el organismo superior intacto, En su reseña 
de tal trabajo, Thompson y sus asociados (1971, pág. 86) comentan : '“El proble- 
ma fundamental de la inferencia es la mayor debilidad del enfoque del sistema mo- 
delo: no hay garantía de que los modelos produzcan nada más que juegos intere- 
santes muy irrelevantes para una comprensión de) aprendizaje en los vertebrados 
superiores””. De modo similar, Kupfermann y Pinsker (1969, pág. 382) señalan: 
“No puede pasarse por alto la importancia de la enorme laguna existente entre el 
conocimiento de las propiedades plásticas (de aprendizaje) de las neuronas estu- 
diadas en preparaciones simples y el conocimiento de Ja base fisiológica del refor- 
zamiento y el aprendizaje en los animales intactos””. Sin embargo, esta es un área 
en la cual cabe esperar estudios neurofisiológicos intensivos, con base en el argu- 
mento de que tenemos pocas oportunidades de comprender sistemas complejos, a 
no ser que primero podamos analizar y entender totalmente el caso más simple. 


La neuroquímica del aprendizaje y 
de la experiencia 


Una atrayente hipótesis general para examinar es que los individuos tienen di 
versas capacidades de aprendizaje debido a diferencias en la bioquímica de sus ce- 
rebros. Esta no es una suposición inadmisible ya que la transmisión de las señales 
neurales es en gran parte una cuestión de química. Tal vez los individuos brillantes 
y los tontos difieran en la cantidad o en la forma de distribución en el cerebro de 
sustancias químicas esenciales particulares, o quizás en la distribución de sustan- 
cias químicas antagónicas que deben mantenerse en delicado equilibrio para el 
apropiado funcionamiento de la mente, 

Si intentamos descubrix cómo se relaciona la química cerebral con la conducta, 
las primeras preguntas se referirán a qué sustancias químicas buscar y en qué lu- 
gar del cerebro. Un enfoque consiste en medir la cantidad total de alguna sustancia 
quínica en áreas generales del cerebro; por ejempla, en toda la corteza de una 
rata, Una opción podría ser medir su cantidad y cómo cambia en unas cuantas célu- 
las neurales localizadas en estructuras cerebrales específicas, contempladas en la 
conducta que estudiamos. Otra lnea de investigación emplea a la química cerebral 
alternativamente como variable independiente y dependiente, En el primer caso, 
el objetivo es establecer cómo varía la conducta en alguna tarea estándar en indivi- 
duos que tienen distintas distribuciones de sustancias químicas cerebrales (por 
ejemplo, debido a la edad o a diferencias genéticas). En el segundo caso, se mane- 
jan las experiencias de crianza y de aprendizaje de los animales de un grupo gené- 
tico común, y se determina si su química cerebral cambia a no como restiltado de la 
experiencia. Otro enfoque consiste en manipular los procesos neuroquímicos en las 
sinapsis mediante la inyección de drogas de acción centra?, y luego verificar si se 
presentan los efectos conductuales esperados. En la mayor parte de los casos, el 
mismo investigador utiliza varias perspectivas distintas. En las siguientes sec- 
ciones examinare mos una línea de trabajo representativa del enfoque general rela- 
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tivo de la química cerebral, y otras dos que son características del punto de vista 
sináptico. 


Ambientes enriquecidos y trausmisores cerebrales 

Como hemos visto, uno de los transmisores en la sinapsis cortical es la acetilco- 
lina (AC). Después de que un impulso axonal libera acetilcolina en la brecha sináp- 
tica (posiblemente iniciando un impulso postsináptico), la colinesterasa (CE) entra 
en juego para metabolizar la AC y restaurar el funcionamiento de la sinapsis. 

Un grupo de científicos de la Universidad de Cahfornia, los psicólogos Krech y 
Rosenzweig y el bioquímico Bennett, dirigieron un programa de investigación 
acerca de las concentraciones CE en los cerebros de las ratas. Se utiliza la CE 
porque sus mediciones son relativamente fáciles de obtener, mientras que las eva- 
luaciones confiables de la AC resultan difíciles. Durante un largo periodo de inves- 
tigaciones, estos científicos cambiaron gradualmente su interés (en función de los 
datos obtenidos) acerca de qué mediciones de la química cerebral deberían usar 
para encontrar correlaciones confiables con la conducta. La medida que en un prin- 
cipio parecía más discriminativa era la proporción de la actividad CE cortical total 
con la actividad EC subcortical total, denominada razón C/S (por cortical/ 
subcortica), Los valores bajos de esta razón C/S se asocian con el apren- 
dizaje rápido de problemas de laberinto. En un estudio (Krech et al., 1960), las ra- 
tas criadas en un ambiente sensorial “enriquecido”, lleno de juguetes y de otras 
ratas, tuvieron razones C/S de aldulto, inferiores a las de aquellas que crecieron en 
condiciones de relativo “aislamiento”, en jaulas pequeñas y cerradas, desprovis- 
tas de otros objetos y sin las demás ratas. En posteriores pruebas de aprendizaje 
de laberinto (Krech et al, 1962) los sujetos ““enriquecidos'* también aprendieron 
con mayor rapidez. En cada condición de crianza, las diferencias individuales en la 
razón C/S se correlacionahan con los errores cometidos en el problema de apren- 
dizaje de laberinto. La correlación resultó de 0.81 en los animales criados en el 
ambiente enriquecido, y de 0.53 en los que crecieron en aislamiento. Esto de- 
muestra que existe una muy fuerte correlación entre la química cerebral y la velo- 
cidad del aprendizaje. 

En otros estudios se examinaron ratas de distintas descendencias genéticas en 
busca de diferencias en la razón C/S. En el laberinto se ha realizado una serie de 
estudios con las descendencias genéticas de ratas listas y tontas, que criara 
Tryon. El examen de los cerebros de estas ratas demostró que en el laberinto la 
razón C/S era más baja en los sujetos listos que en los tontos, Esto concuerda con 
los resultados anteriores; es decir, que las razones bajas de C/S tienden a produ- 
cir un aprendizaje más rápido. En un experimento genético de Roderick (1960) se 
criaron ratas selectivamente, unas para que tuvieran niveles elevados de CE cor- 
tical y otras para que los tuvieran bajos. Después de varias generaciones en las 
cuales se cruzaron altos con altos y bajos con bajos, en las dos poblaciones hubo 
poca superposición en las distribuciones de los niveles de CE cortical. Se de- 
mostró así que la química cerebral es controlable por medio de la selección genéti- 
ca a partir de un tronco genético común. 

Aunque estos estudios por lo general han tenido éxito en lo que toca al descubri- 
miento de diferencias individuales y de raza en la química del cerebro, las cuales se 
correlacionan con el aprendizaje, la mvestigación se topó con un problema in- 
terpretativo. Aunque la razón C/S se correlacionaba empíricamente, nadie en- 
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contró una explicación convincente para esto. Sin embargo, estudios posteriores 
han proporcionado una. ¡El primer hallazgo fue que la corteza cerebral de las ratas 
de crianza enriquecida (CEN) es más grande que la que poseen las de crianza 
aislada (CA)! Bennett y sus asociados (1964) descubrieron que la corteza de las 
ratas CEN es más gruesa y pesada. Como el incremento en la actividad de la coli- 
nesterasa de la corteza es relativamente menor que su aumento de tamaño, la ac- 
tividad de la CE por unidad de peso disminuye en la corteza de las ratas CEN, La 
actividad de la CE en la subcorteza sigue siendo casi la misma, mientras que el 
peso de la subcorteza es ligeramente inferior en las ratas CEN, lo que contribuye 
a que hava mayor actividad de la CE de la subcorteza por unidad de peso. Esto 
explica por qué la razón C/S de actividad de la CE en la corteza es inferior en las 
ratas CEN, El segundo descubrimiento, de Globus, Rosenzweig, Bennett y 
Diamond (1973), es que las neuronas corticales de las ratas CEN tenían más 
fibras dendríticas, lo cual implicaba mayor sinapsis en cada célula. 

El hallazgo de un cambio en el tamaño de la corteza y de más crecimientos den- 
dríticos de las neuronas corticales constituyó una gran sorpresa para los científicos 
dedicados a la investigación del cerebro. Ántes de esto, pocos expertos habrían 
creído que los efectos de un ambiente sensorialmente enriquecido podrían inducir un 
cambio tan ““obvio”” en el cerebro. En la actualidad los efectos se han repetido va- 
rias veces, y siempre están presentes en la comparación CEN-CA. La magnitud 
del cambio varía en diferentes áreas de la corteza, y es mayor (alrededor del 10% 
por peso) en la corteza visual. Pero se recordará que la complejidad de la entrada 
visual es uno de los principales factores que diferencia a las dos condiciones de crian- 
za. En busca de un '“periodo crítico'* de la experiencia inicial (Rosenzweig el al. 
1964), dos grupos de animales se criaron en el mismo ambiente, el lugar usual de 
la colonia, hasta una edad de 105 días; luego se les separó: unos vivirían en un am- 
biente enriquecido y otros en el medio empobrecido. Después de 85 días se en- 
contró que los dos grupos de ratas diferían sensiblemente en su peso cortical y en 
la actividad CE, de la misma forma que cuando la crianza diferencial se instauró a 
partir del nacimiento, lo cual significa que los cerebros de las ratas que habían teni- 
do una vida empobrecida podían crecer si durante su adolescencia se las ubicaba 
en un medio enriquecido. Esto demuestra que no hay ningún **periodo crítico”” an- 
tes de que el animal deba ser expuesto al ambiente enriquecido a fin de producir 
un aumento en el tamaño de su corteza. 

Las investigaciones en cuestión originaron un cierto número de trabajos de se- 
guimiento que investigan las diferencias individuales y de raza en el tamaño de la 
corteza y en la habilidad de aprendizaje visual. Todavía necesitamos explicar de 
qué forma un medio estimulante conduce a un aumento selectivo en el tamaño 
de la corteza, crecimiento dendrítico, por qué los individuos que tienen una corte- 
za ligeramente más grande o más arborescente aprenden problemas de laberinto 
con mayor rapidez que sus parientes que poseen una corteza más delgada. Apa- 
rentemente, el tejido nervioso $e comporta del mismo modo que los músculos, que 
aumentan de tamaño con el ejercicio. Hasta hace muy poco una opinión como esta se 
habría considerado una trivialidad increíble en cualquier estudio neurológico serio. 


Neuroquímica celular 
Hay une línea de investigación contemporánea muy activa que parte de la hipó- 
tesis de que la base física de la memoria reside en un cambio relativamente dura- 
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dero de los constituyentes bioquímicos de una neurona que controla su respuesta 
de forma selectiva. Esto señalaría que se podría construir un engrama mediante 
ciertos cambios bioquímicos que tienen lugar en muchas de las células de un cir- 
cuito neuronal activadas por la experiencia del aprendizaje. 

Por varias razones, durante una época se pensó que el ácido ribonucieico (ARN) 
era el candidato lógico para representar este papel de molécula de la memoria. 
Abunda en las células nerviosas, en el interior de su estructura posee un almacén 
potencialmente grande para guardar información codificada (tema que explicare- 
mos a continuación), y determina y controla la forma especifica de las proteínas 
que se sintetizan dentro de una célula. El ARN es el primo hermano del ADN (áci- 
do desoxirribonucleico) que, según se ha establecido recientemente, es el mate- 
rial hereditario que contiene los genes de los cromosomas de cada célula. Dentro 
de su compleja estructura el ADN posee la suficiente información codificada para 
especificar el carácter fenotípico del organismo (es decir, su apariencia), y ejerce 
influencia al controlar las reacciones bioquímicas de formas compl.cadas. 

El ARN es una molécula muy grande, de hilera simple (un polímero), que se 
compone de la secuencia recurrente de un fosfato y un par de azúcares conectada 
con cualquiera de las cuatro '“bases”* siguientes: adenina, guanina, uracil y citosk 
na. Una de las cuatro bases seguida de un fusfato y un azúcar constituye los cuatro 
tipos de eslabones usados para componer una extensa cadena en forma de rosario. 
La molécula de ARN es muy larga (probablemente de varios miles de unidades), 
de modo que el número de posibles combinaciones de las cuatro bases que inte- 
gran la secuencia es muy amplio. Para ilustrar este aspecto, supóngase que cada 
molécula tuviera 2 000 eslabones de largo, y en cada posición se presentara algu- 
na de las cuatro bases. Entonces el número de diferentes variedades de la molécu- 
la podría ser de 4? %, que es una cantidad en verdad elevada, Esto es importante 
porque muestra la cantidad de información que podría codificarse potencialmente en 
una molécula de ARN. Esta capacidad se aprecia mejor si se recuerda que el cód+ 
go Morse traduce una letra del alfabeto en una hilera simple de cuatro o cinco uni- 
dades binarias (un punto o un guión). En comparación con dicho código, una hilera 
de ARN compuesta de 2 000 unidades con cuatro opciones en cada unidad podría 
codificar y almacenar un mensaje cuya extensión abarcara alrededor de 1 000 letras 
o de 200 palabras. Si la información se codifica o no en el ARN, cómo se lleva a 
cabo y cuál es el código, son preguntas que aún no se han contestado. Sin embar- 
go, lo importante es que el ARN, tiene el potencial para desempeñar el papel de 
un almacén de información biológica. 

Si esto fuera todo lo que pudiera decirse acerca del ARN, hubiera permanecido 
sólo como un tema de especulación ociosa. Pero existe una verdadera erupción de 
pruebas conductuales que parecen impbcar al ARN como una posible molécula 
de la memoria. Por un lado, su concentración en las células cerebrales humanas se 
incrementa con la edad y luego disminuye, de la misma forma que la capacidad de 
aprendizaje. Se ha informado que la memoria inmediata de las personas de edad 
mejora si se agregan complementos de ÁRN a su dieta; sin embargo, este resulta- 
do no se ha obtenido en repeticiones recientes. Es más pertinente el hecho de que 
la concentración de ARN en las células neurales se incrementa cuando se les es- 
timula reiteradamente. 

Cuando la estimulación de una célula, es importante para el aprendizaje de una 
habilidad, no sólo aumenta el ARN de esa célula sino que cambia su carácter, lo 
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cual se indica por las cantidades de las cuatro bases (la **proporción de bases”') 
que se encuentran en el análisis del ARN que se efectúa después del aprendizaje. 
En un estudio de Hydén y Egyházi (1962) se enseñó a las ratas a equilibrarse y su- 
bir por una cuerda tensa e inclinada a fin de obtener una recompensa alimenticia. 
Después del aprendizaje se examinó el ARN del núcleo vestibular. Éste es un haz 
de fibras que retransmite al cerebro las señales provenientes de los canales semi- 
circulares, Órganos receptores implicados en el mantenimiento del equilibrio de la 
postura. La cantidad de ARN del núcleo de las células de esta región aumentó gra- 
cias a la experiencia del aprendizaje. y la especie dominante de ARN fue de un tipo 
distinto (con una proporción diferente de bases) del de las ratas de control que 
sufrieron la estimulación de sus canales semicirculares, aunque éstas no nabían re- 
cibido entrenamiento especial para caminar y equilibrarse en la cuerda tensa. Por 
el contrario, a estos animales de control sólo se les hizo girar en una jaula oscilato- 
ría pequeña, cuyo movimiento estimula los canales semicirculares. Un problema 
interpretativo con este estudio es que nadie podía conjeturar la significación adap- 
tativa del cambio en tal estación de relevo sensonal de bajo nivel. 

En un trabajo posterior (Hvdén y Egvházi, 1964) se entrenó a ratas ““diestras”” 
a fin de que usaran sus patas izquierdas para recoger trozos de alimento del come- 
dero. Las células neurales que se tomaron de ciertos estratos de la corteza cere- 
bral opuesta (derecha) mostraron aumentos en la concentración de ARN, y se 
prudujeron cambios en la proporción de bases de la especie de ARN dominante. 
Estas células especiales se extrajeron de las regiones corticales involucradas en el 
uso de la mano izquierda, lo cual se infere del informe de que la destrucción de es- 
ta región puede incapacitar a la rata para aprender la habilidad de coger cosas cun 
la pata izquierda. 

En la interpretación de estos resultados surgen algunas dificultades. En primer 
lugar figura la adecuación de los controles. Como la estimulación o el ejercicio per 
se aumenta la cantidad de ARNM en las neuronas implicadas, y el patrón del ejerci- 
cio puede alternar el tipo de ARN, el problema consiste en diseñar el experimento 
de modo que los sujetos que aprenden y los sujetos de control —que no 
aprenden— reciban casi el mismo patrón de estimulación de entrada. En este sen- 
tido, los controles usuales no son los apropiados. Segundo, los cambios que pro- 
duce el aprendizaje en la especie dominante de ARN se limitan a lo que se en- 
cuentra en el núcleo de la célula, no en su citoplasma. Tercero, los cambios del 
ARN nuclear aparecen inmediatamente después de que el animal ha estado ac- 
tuando en la situación de aprendizaje, pero dejan de ser detectables si después de 
la sesión de aprendizaje se espera 24 horas para sacrificar al animal y determinar 
su ARN (véase Hydén, 1965); es decir, después de ese lapso las diferencias de 
ARN entre los sujetos que aprenden y los sujetos de control se tornan impercep- 
tibles, Según el criterio del investigador, estos hechos pueden interpretarse como 
refutación o como apoyo de la hipótesis de la memoria ARN. 


Estudios de la iransferencia de la memoria 

Las líneas de evidencia ofrecidas para la hipótesis de la memoria ARN han sido 
de dos tipos: supuesta transferencia biológica de extractos cerebrales que con- 
tienen ARN y memoria de un individuo a otro, y los efectos conductuales de las 
drogas que inhiben la acción del ARN en las proteínas celulares sintetizantes. En 
los estudios de transferencia iniciados por McConnell (1962) y sus asociados, se 
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entrena a un sujeto hasta que ha aprendido un hábito. Entonces su cerebro es ho- 
mogeneizado y el *“compuesto'” bioquímico se inyecta en un sujeto sencillo; de ailí 
en adelante se le somete a pruebas para verificar si también puede ejecutar el há- 
bito en mayor medida que los sujetos de control que recibieron sopas cerebrales 
de donantes no entrenados. (La sopa es una mezcla de proteínas, transmisores 
neurales, ARN, y tal vez mucho más.) Se ha informado de un efecto de transfe- 
rencia en planarias, peces dorados, ratas y ratones (véanse Gaito, 1966, y Fjer- 
dingstad, 1971, para reseñas). La llamativa naturaleza de tales efectos de transfe- 
rencia provocó innumetables investigaciones y un caudal de resultados conflictivos. 
El que se encontrara o no esa transferencia parecía variar según la especie utiliza- 
da, los detalles exactos del procedimiento, los métodos empleados para la extrac- 
ción del ARN y otras proteínas del cerebro de los donantes entrenados, y el lugar 
de la inyección en el receptor. Por ejemplo, en las ratas es evidente que una pe- 
queña cantidad en una inyección intraperitoneal de ARN llega al cerebro del re- 
ceptor, y tales efectos parecen depender de ““inpurezas'” en vez de la ARN en el 
compuesto. Los efectos de transferencia a menudo son pequeños, transitorios, y 
dependen de condiciones sumamente específicas (véase la reseña de estudios 
conflictivos realizada por Chapouthier, 1973). En la actualidad, la mayoría de los 
neuropsicólogos desconfían de los resultados de la transferencia. 

Ungar y sus colaboradores (1968) informaron de la purificación de un polipéptido 
de extractos cerebrales de ratas entrenadas que transteriría cierto tipo de memo- 
ría a una rata ingenua, El primer animal recibía descargas eléctricas en ei lado os- 
curo de una caja de dos compartimientos y, por lo tanto, aprendía a permanecer en 
el lado iluminado (al que antes no prefería). Ungar informó que las ratas ingenuas 
que recibían el extracto cerebral de los animales entrenados evitaban el lado oscu- 
ro de la cámara de prueba con más frecuencia que las que recibían extractos cere- 
brales de sujetos de control que no habían sufrido descargas. Á este fenómeno 
lo denominaron escotofobina polipéptida purificada, lo cual significa **temor a la os- 
curidad”. 

Un problema interpretativo es que la transferencia tal vez no sea específica para 
el aprendizaje causado por pares de luz-descarga, más bien, los sujetos que reci- 
ben descarga podrían liberar alguna hormona de estrés que, al inyectarse a otros, 
hacía que prefieran los ambientes más claros. Para que se le categorice como 
aprendizaje, debemos demostrar que el resultado depende fundamentalmente del 
pareamiento de la oscuridad con la descarga. Se necesitaban sujetos de control 
que recibieran descargas no contingentes en las patas no pareadas con la luz ó la 
oscuridad. La naturaleza crítica de tales controles para la transferencia no 
específica se demostró en un experimento de Frank y sus asociados (1970). Algu- 
nos de sus ratones estaban entrenados en una tarea de evitación de descarga; 
otros se sometían a tensión al hacerlos rodar dentro de una jarra y otros más no se 
les hacía nada. Después, todos eran sacrificados, y se les sacaba extractos bioquí- 
micos del cerebro y del hígado, que se inyectaban a ratones nuevos que aprendían 
la misma tarea de evitación de descarga. Los resultados demostraron una ejecu- 
ción superior en la tarea de evitación de descarga en los ratones que recibían el 
extracto, ya fuera en los entrenados o en los sometidos a estrés, aunque estos úl- 
timos donantes no podrían haber aprendido nada acerca de la tarea de evitación. 
¡Además, la transferencia o facilitación de la ejecución era tan grande cuando a los 
nuevos aprendices se les aplicaba una inyección de extracto de hígado, que sí 
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recibían extractos cerebrales! Sin embarga, nadie se atrevería a afirmar que los 
recuerdos se almacenan en el hígado ni que son adquiridos por él. Este exper- 
mento de control sugiere que por sí solo el estrés libera una hormona o agente 
neurohumoral en el cuerpo de un donante, que por un tiempo puede tener un efec- 
to generalizado no específico en la conducta de un receptor. (Un ejemplo es la 
transferencia de drogas adictivas por medio de la sangre de la placenta entre la 
madre y el feto: éste es adicto durante un tiempo después del nacimiento.) 

Las conclusiones acerca de este tema han estado enmarañadas en la polémica, 
es resultados conflictivos y en la argumentación más controvertida, Desgracia- 
damente, a causa de las políticas de las publicaciones científicas, en los informes, 
sólo aparecen los resultados “pasitivos'?, de modo que los estudios que se difun- 
den probablemente sean una muestra prejuiciada de todos los intentos de provo- 
car un efecto. 


Drogas que inhiben la sintesis del ARN 

En un esfuerzo por afectar el aprendizaje y la memoria mediante el manejo 
de la disponibilidad del ARN en sinapsis críticas, algunos expertmentadores 
han empleado drogas antibióticas (puromicina, cicloheximidas, actinomicina) 
que inhiben la síntesis de las proteínas. La húpótesis es que la consolidación y el 
mantenimiento de una memoria requiere de una síntesis constante de las 
proteínas (es decir, elaboración continua de proteínas neuronales de un tipo espe- 
cial seleccionado durante el condicionamiento), y que la perturbación o inhibición 
de esa síntesis produciría alguna pérdida de las memorias recientes. Por ejemplo, 
los ratones que reciben inyecciones de puromicina en el cerebro antes del entre- 
namiento, aprenderán un hábito de laberinto con tanta rapidez como los animales 
de control, pero parecen olvidarlo con más facilidad (véase Barondes y Cohen, 
1966). En una prueba de retención de 3 horas (reaprendizaje), los ahorros fueron 
de 91% para los controles en comparación a sólo 7% de los ratones inyectados con 
puromicina. Sin embargo, los investigadores descubrieron que virtualmente no 
había efecto sobre la retención de las inyecciones de ciclohexamida, droga similar 
ala puromicina en la inhibición de la síntesis de las proteínas. Cohen, Ervin y Ba- 
rondes (1966) sugieren que la puromicina puede ser efectiva sobre los recuerdos, 
mientras que la ciclohexamida no lo es porque sólo la primera droga induce una ac- 
tividad eléctrica anormal en la región hipocampa!. El otro inhibidor de la síntesis 
ARN, la actinomicina, ha tenido efectos inconsistentes en el aprendizaje, depen- 
diendo de la tarea y de la especie. 

Los estudios que han usado puromicina y ciclohexamida están plagados de m- 
consistencias y de resultados que no pueden interpretarse. En relación con tales 
investigaciones se reconocen dos problemas principales. Primero, no hay ningún inhi- 
bidor que deje fuera de combate selectivamente al ARN; más bien cada droga 
tiene una amplia extensión de efectos (por ejemplo, E£G anormales), y la ejecu- 
ción puede verse alterada debido a estos efectos secundarios. Segundo, los inhúbi- 
dores del ARN no cierran por completo todas las síntesis de las proteinas (de otra 
forma, el animal moriría), así, el hecho de que no exista amnesia después de la re- 
cepción de un inhibidor ARN podría significar que lo que se deja es adecuado para 
realizar el trabajo. En virtud de la inconsistencia de los resultados, muchos teóri- 
cos se manifiestan escépticos en lo que toca a la hipótesis básica, Al revisar estos 
trabajos, Carlson afirma: 
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Es impasible ayenturar una conclusión acerca de estos estudios. Muchos investigado- 
res creen que la sintesis de las proteínas es necesaria para la consolidación de la memoria, 
pero no debido a la evidencia experimental... Más bien esta creencia se apoya en nuestro 
conocimiento del papel que las proteínas desempeñan en la bioquímica del cambio estruc- 
tura). Es muy posible que nunca encontremos una droga que, mediante la supresión gene- 
ral, impida de modo efectivo la consolidación de la síntesis de las proteínas. Tal vez tenga- 
mos que averiguar qué proteínas intervienen en la consolidación, y cómo funcionan, antes 
de que estemos en condiciones de probar que su inhibición selectiva puede impedir que las 
memorias de corto plazo se conviertan en memorias de largo plazo. Probablemente deba- 
mos aguardar mucho (1977, págs. 603-8604). 


Carlson (1977) también revisa las investigaciones acerca del acrecentamiento 
de la memoria o de la habilidad de aprendizaje al proporcionar drogas (como pemo- 
lina de magnesio) que facilitan la síntesis ARN. Desafortunadamente, esa investi- 
gación tampoco ha arrojado resultados consistentes y positivos, de manera que el 
citado autor escribe: 


Puede llegarse a la conclusión de que no hay evidencia sólida acerca de las mejorías en 
el aprendizaje producidas por la facilitación de los procesos biosintéticos que intervienen 
en el cambio físico (pág. 604). 


La credibilidad de la hipótesis de la memoria ARN se reduce aún más por la 
ausencia de una teoría plausible y articulada que explique con exactitud cómo se 
relacionan —o podrían relacionarse — el ARN y la memoria. Por ejemplo, ¿por qué 
medios y a partir de qué pasos altera la experiencia al ARN en una neurona? 
¿Cómo los impulsos eléctricos de un patrón temporal y frecuencia particulares 
constituyen la única información que llega a una neurona? ¿De qué manera se tra- 
duce esta información a un código bioquímico dentro del ARN? ¿Cómo se recupera esta 
información? ¿De qué forma la especie ARN dominante en el núcleo de una neurona 
controla selectivamente las propiedades de transmisión de la membrana celular? 
Éstas son preguntas difíciles; pero la dificultad que implica responderlas adecuada- 
mente, así como los resultados empíricos conflictivos, han reducido el carácter 
plausible de la hipótesis de la memoria ARN. 


Eficiencia de las sinapsis colinérgicas 


Ya sea que los cambios ARN contengan o no al sustrato bioquímico del aprendi- 
zaje, la hipótesis general más aceptable es que el aprendizaje implica una mayor 
eficiencia de las sinapsis que intervienen para mediar la respuesta aprendida con 
éxito. Una serie de experimentos de Deutsch y sus asociados (reseñados en 
Deutsch y Deutsch, 1973) ha comprobado una forma especial de esta hipótesis. 
Específicamente, se propone que las experiencias del aprendizaje inician procesos 
que causan sinapsis colinézgicas en las vías neuronales reforzadas (de la cadena E- 
K) del cerebro, para producir concentraciones más efectivas de acetilcolina duran- 
te la transmisión. El aprendizaje se identifica así con el crecimiento gradual en la 
eficiencia de la transmisión, mientras que el olvido es el proceso opuesto. Deutsch 
ha investigado esta hipótesis al notar la influencia que las drogas ejercen sobre la 
memoria y que, como se sabe, afecta la transmisión en las sinapsis colinérgicas. 
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Los detalles de los mecanismos Sinápticos se explican mediante el diagrama de 
la figura 14.2, que idealiza una sinapsis simple. Un impulso eléctrico que viaja por 
el axón presináptico hace que se liberen paquetes de acetilcolina (AC) de pe- 
queñas vesículas de la terminal presináptica. Éstas se mueven a través de la hen- 
didura sináptica para ajustarse hábilmente en una población de sitios receptores 
hechos a la medida en la terminal postsináptica, cada uno de los cuales genera pe- 
queños cambios en el potencial eléctrico a través de la membrana postsináptica. Si 
se absorbe bastante transmisor se integra un cambio potencial apreciable, de 
modo que se generará un impulso a lo largo de la neurona postsináptica. La coli- 
nesterasa neutraliza o ““absorbe”* a la AC poco después de su liberación. Puede 
pensarse que las móleculas de colinesterasa están constantemente disponibles en 
alguna concentración en la solución que rodea la sinapsis. Si se produce AC en ex- 
ceso o si la colinesterasa no la destruye, la célula RÍ será “encerrada” (hiperpola- 
rizada) e incapaz de disparar otra vez hasta que se haya limpiado el exceso de AC, 

¿Por qué medios podemos acrecentar la habilidad de la terminal presináptica 
(denominémosla EC) para disparar la célula postsináptica (llamémosla RD)? Una 
forma consistiria en hacer que la terminal EC liberara más AC cuando se le estimu- 
la, de modo que una célula EC que antes era inefectiva ahora se hace completa- 
mente eficaz para disparar a la célula R7 por sí sola. Una segunda manera sería 
incrementar la sensibilidad o capacidad de respuesta de la membrana postsináptica 
para una cantidad fijada de trans:misor liberado en la terminal presináptica. Esto se 
conseguiría al incrementar el número de sitios receptores efectivos que producen 
AC, o al disminuir el umbral potencial requerido para disparar la neurona R/. 

Con este marco de referencia, considérese la acción de dos tipos de drogas 
sobre la transmisión sináptica. Primero están las drogas anticolinesterasa (como la 
fisostigmina y la DFP), que reducen la colinesterasa en las sinapsis. Esto tiene el 
efecto secundario de incrementar la cantidad de AC (liberada por la terminal EC), 
que es absorbida por la terminal Rf. El efecto de este aumento en la AC efectiva 
sobre la transmisión sináptica no es el de un simple acrecentamiento. Si los niveles 
AC son bajos, las drogas anticolinesterasa incrementarán la eficiencia del disparo 
de la célula RÍ para una entrada EC dada. Pero silos niveles de AC para la estimu- 
lación EC ya son muy altos, la adición del incremento de anticolinesterasa puede 
causar hiperpolarización (“*cierre'”) con la consecuente disminución de la transmi- 
sión sináptica neta. 

Ahora considérense las drogas anticolinéngicas como la escopolamina y la atro- 
pina; estas moléculas son absorbidas por los sitios receptores en la terminal post- 
sináptica, lo cual excluye de ellos a la AC, pero la absorción de las drogas anticoli- 
nérgicas no hace que se generen impulsos eléctricos en la neurona RI. Éstas se 
denominan drogas de bloqueo porque bloquean o reducen la acción normal de la 
AC. Su efecto sobre la sinapsis consiste en reducir su eficiencia de disparo para 
una cantidad dada de AC liberada por la terminal EC. 

Deutsch ha empleado drogas anticolinesterasa y de bloqueo para rastrear 
hipotéticos cambios en el transcurso del tiempo (después del aprendizaje) en la 
eficiencia de la transmisión a lo largo de una sinapsis contenida en el circuito 
neuronal aprendido y exitoso. Las predicciones, así como los datos empíricos, 
pueden organizarse de acuerdo con el diagrama hipotético de la figura 14.8, que 
muestra el nivel efectivo de acetilcolina (AC) que se cree es liberado por una esti- 
mulación EC, al comprobarse en diversos momentos después del aprendizaje ini- 
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cial. Para asimilar las diferentes partes de esta figura, considérense primero las 
curvas normales (no drogas). Después de una sesión de experiencias de aprendi- 
zaje, se supone que el nivel de AC se acumula como una MCP, y se disipa durante 
el primer día, más o menos. Seguidamente, hay una consobdación creciente de un 
cambio de “largo plazo”” en el AC efectivo en las sinapsis de aprendizaje. En opi- 
nión de Deutsch, esta consolidación es autónoma y continúa durante unas cuantas 
semanas. Después, y sin que se le use, el sustrato AC del hábito comienza a dis- 
minuir y conduce al ““olvido””, debido a la falta de uso del hábito. La relación entre 
el nivel AC efectivo y la eficiencia sináptica es compleja, como ya hicimos notar. 
Por debajo de un umbral inferior, no ha habido suficiente cambio en la eficiencia si- 
náptica como para disparar eficazmente las sinapsis que intervienen a lo largo de 
todo el circuito que media la ejecución exitosa del acto aprendido; por encima 
de un umbral superior (designado como el “nivel de hloque'* en la figura 14.8), 
hay más AC de la que la colinesterasa puede neutralizar, lo cual produce hiperpo- 
larización y “cierre”? de la sinapsis. El efecto conductual en este segundo caso su- 
puestamente es un debilitamiento de la respuesta o una incapacidad para ejecutar 
el hábito aprendido. Así, la ejecución óptima debería producirse cuando el AC 
efectivo está en la extensión medía. El efecto de una droga anticolinesterasa 
(DFP o fisostigmina) consiste en elevar la curva entera para la “AC efectiva” en 
la figura 14.8, mientras que un agente colinérgico de bloqueo (escopolamina) dis- 
minuye Ja curva total, Estas curvas punteadas han de interpretarse como la canti- 
dad electiva de AC liberada por el EC después de la inyección de la droga indicada 
en diversos momentos luego del aprendizaje inicial. La magnitud de alejamiento de 
lo normal en los dos casos depende por supuesto, de la dosis de droga inyectada. 

Este cuerpo de premisas interrelacionadas es muy complejo; sin embargo, los 
datos parecen apoyar a varias de ellas. Un primer conjunto de hechos se refiere a 
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Figura 14.9. Efecto de algunas drogas sobre la memoria. Los resultados de los experi- 
mentos con ratas en laberintos Y muestran la forma en que dos tipos de drogas, agen- 
tes de bloqueo fescopolamina) e inhibidores (DFP), pueden producir amnesia o re- 
cuerdo, dependiendo del tiempo de inyección después del aprendizaje (tomada de 
Deuísch, 1968). 


las inyecciones de DFP en contraposición a la esoopolamina, es diversos momen- 
tos posteriores al aprendizaje. En el experimento usual, se entrena a una rata en 
una sesión con ensayos masivos en un laberinto Y para escapar de la descarga 
eléctrica, al doblar en el brazo iluminado y evitar el brazo oscuro del laberinto. Por 
lo común, el entrenamiento se lleva a un criterio de diez elecciones consecutivas 
correctas, Después de un intervalo de descanso de media hora, un día, 3 días, una 
semana, 2 o 4 semanas, se administró DFP o escopolamina, a un cierto número 
de ratas y las de control recibieron una inyección con solución neutral. En cada in- 
tervalo de retención se someten a prueba grupos diferentes de animales y se les 
da una de las tres inyecciones. Después se le somete a prueba para su retención 
en el laberinto Y, y vuelve a aprender el hábito originalmente entrenado. En la f- 
gura 14.9 se describe la retención efectiva observada en las tres clases de anima- 
les. Las puntuaciones de retención confirman detalladamente la teoría. Primero, 
los animales de control que han aprendido un hábito fuerte muestran inicialmente 
un gradual olvido en el curso del tiempo anterior a la prueba. Los que reciben una 
anticolínesterasa como la DFP, que eleva la cantidad de AC efectiva disponible, 
muestran buena memoria si se les inyecta y comprueba en uno y en 3 días, mala 
retención en una o 2 semanas, y buena si se les inyecta y se les somete a prueba 
después de una demora de 4 semanas. Los animales que reciben el agente de blo- 
gueo colinérgico (escopolamina), muestran casi lo contrario de los efectos DFP: la 
memoria se perturba cuando la inyección de escopolamina y la prueba tienen Jugar 
después de uno o 3 días, es casi perfecta cuando la inyección y la prueba ocurren 
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después de una o 2 semanas, pero de nuevo se perturba cuando ambas se aplican 
4 semanas después del aprendizaje original. Estos efectos son las que pronostican 
las hipotéticas curvas de transmisión sináptica que aparecen en la figura 14.8. Por 
ejemplo, la DFP produce una ejecución pobre en el intervalo de 2 semanas porque 
eleva la cantidad de AC efectiva en la sinapsis por encima del mivel de bloqueo, lo 
cual produce hiperpolarización y mala transmisión. 

A fin de verificar la hipótesis de la consolidación del mejoramiento espontáneo 
de la memoria en el transcurso del tiempo y mediante drogas, se sudentrenó a los 
animales sólo con un pequeño número de ensayos reforzados (escapes de cho- 
ques) en el hábito original. Después de un determinado periodo, que variaba de un 
día a varias semanas, estas ratas sube ntrenadas volvieron a colocarse en el labe- 
rinto para que aprendieran nuevamente el hábito original. Como era de esperar, 
los animales sometidos a prueba a los 7 o 10 días mostraron mejor ruemoría que 
aquellos examinados después de uno o 3 días, o luego de varias semanas (véase 
Huppert y Deutsch, 1969). En experimentos posteriores de Huppert se encontró 
un efecto similar de “reminiscencia” en los hábitos motivados por el apetito y re» 
forzados con recompensas alimenticias. 

Se obtuvo más evidencia con animales subentrenados o sobreentrenados en el 
hábito original, y cabe presuponer que estas diferencias corresponden a distintos 
grados de '*consolidación”” afectada por el fin del entrenamiento. Las inyecciones 
de DFP (o de una solución neutral) y la prueba se aplicaban 5 o 6 días después. En 
los animales subentrenados, la DFP aumentaba la ejecución de memoria por enci- 
ma de Ja de aquellos no drogados; pero en los sobreentrenados, la DFP hacía que 
se desempeñaran mucho peor que sus controles no drogados. Este fenómeno 
puede atribuirse al bloqueo (hiperpolarización) de un hábito bien consolidado por el 
exceso de AC acumulada cuando gran parte de la colinesterasa ha perdido sus pro- 
piedades por el suministro de la DFP. Aparece un resultado similar si se da a los 
animales un número fijo de ensayos de entrenamiento, pero con una discrimina 
ción de brillantez difícil en contraposición a una fácil. Los animales que aprenden la 
discriminación más fácil deberían tener mayor memoria consolidada después de un 
número fijo de ensayos, que los que aprenden la discriminación dificil. Por lo tanto, 
la predicción es que una inyección DFP después de seis días causa el olvido en el 
grupo con el hábito fácil y bien aprendido, pero da lugar a un incremento en la eje- 
cución del grupo con el hábito difícil parcialmente aprendido. Esta predicción se ha 
confirmado. 

La hipótesis de Deutsch de la eficiencia de la transmisión parece brindar una 
buena interpretación de estos datos, y promete ser una explicación viable de otras 
investigaciones (Deutsch y Deutsch, 1973). Sin embargo, los detalles de los resul- 
tados apenas comienzan a someterse a la réplica sistemática, y precisamente ese 
paso necesario puede revelar resultados inesperados. Un resultado preliminar, 
por ejemplo, es que los efectos de estas drogas sobre la memoria son más fáciles 
de demostrar con ratas que con ratones (Deutsch, comunicación personal, 1972), 
y Se requiere de mucho trabajo de indagación a fin de encontrar la dosis 
**correcta”” para estos últimos con el objeto de duplicar los efectos producidos con 
las ratas. Una característica perturbadora de la hipótesis es que se basa en una 
analogía entre los procesos que ocurren en sinapsis sencillas y el porcentaje de 
elecciones correctas que hace una rata en un labermto. El vacío entre estos dos 
dominios está lleno sólo de alentadoras promesas. Además, toda la evidencia para 
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la hipótesis reside en las manipulaciones con drogas de la retención. Pero se sabe 
que las drogas utilizadas por Deutsch tienen una diversidad de efectos (la escopo- 
lamina a menudo se usa como un sedante o tranquilizante suave), y se desconoce 
hasta qué grado estos efectos directos e indirectos pueden influir en los resulta- 
dos. Otro problema es que muchas de las sinapsis en el sistema nervioso central 
utilizan diferentes transmisores, por ejemplo, doparnina y norepinefrina (adrenali- 
na); y las drogas anticolinesterasa y las de bloqueo colinérgico no afectan a éstas 
de la misma forma que Ja AC. Como tales neuronas predominan en el sistema 
límbico que sirve a los efectos de la recompensa conductual (véase la reseña ante- 
rior del trabajo de Stein), las conjeturas bioquímicas de Deutsch no constituirían 
una descripción admisible de las alteraciones en estas sinepsis centrales que sus- 
tentan la expectativa de recompensa y la motivación de incentivo. Hasta la fecha, 
todas las pruebas de la hipótesis han usado la discriminación de la brillantez en las 
ratas en un laberinto Y, casi sempre el aprendizaje para escapar de la descarga. 
Los índices autónomos del condicionamiento clásico también deben estudiarse 
para comprobar si concuerdan con el olvido evaluado de la conducta instrumental, 
Un problema final con Ja hipótesis de Deutsch: es compleja y tiene un gran número 
de parámetros o constantes arbitrarios. Después de examinar los resultados de un 
experimento para que encaje en las curvas teóricas de la figura 14.8, podemos se- 
leccionar un umbral más bajo, uno superior, una curva de consolidación *'normal'* 
con pico y la llanura necesaria, un incremento para la curva de inyección de DFP, 
y un decremento para la curva de inyección de escopotamina, todo lo cuai se esco- 
gerá para que se ajuste mejor a los datos observados. El problema es si los datos 
pueden proporcionar o no una prueba contundente de un modelo que tiene tantas 
constantes arbitrarias. Aparentemente, sí, pero sin duda es mucho más dificil re- 
probar un modelo con tanta fextbilidad en sus detalles cuantitativos. Sin embargo, 
y a pesar de estas críticas, el trabajo de Deutsch representa algunas de las inter- 
pretaciones más significativas e influyentes de que disponemos en la actualidad pa- 
ra la tesis general de que el aprendizaje implica una eficiencia mejorada de ciertas 
vías neuronales. 

Con estas consideraciones concluye nuestro breve recorrido por la neuro- 
química del aprendizaje. Se trata de un campo muy joven, pleno de sorpresas, 
confusiones y promesas. En las investigaciones o teorizaciones a este nivel 
surgen grandes dificultades técnicas, y el progreso debe ser lento. Para compren- 
der bien el trabajo se necesita un conocimiento muy detallado de la bioquímica, y 
por esta razón no son muchos los psicólogos que se dedican a esta área de inves- 
tigación. Deberá quedar claro que en esta etapa inicial de desarrollo no puede dar- 
se ninguna explicación bioquimica profunda ni siquiera del acto más simple del 
aprendizaje. Sin embargo, cabe esperar que en las próximas décadas haya mayo- 
res progresos en este campo. 


Cambios de las células cerebrales durante el aprendizaje 


Un tema reciente de considerable trascendencia es la identificación de las célu- 
las cerebrales que cambian sus características de respuesta durante el curso de un 
experimento de condicionamiento. El procedimiento básico consiste en colocar 
un conjunto de microelectrados en algunos sitios cerebrales potencialmente inte- 
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] 
resantes, para efectuar registros durante varios cientos de ensayos de una sesión | 
de condicionamiento pavloviano o instrumental. Se tiene la esperanza de localizar 
algunas neuronas que varían sus tasas de disparo en el transcurso del entrena- 
miento, y correlacionar estos cambios con los que aparecen ensayo por ensayo en 
la respuesta conductual la RC) así como las variaciones en las neuronas en otras 
localizaciones. En un estudio pionero de Jasper, Ricci y Doane (1960) se descu- 
brieron cambios en la corteza motora y en la parietal de los monos, mientras 
aprendían a responder con una mano a fin de evitar la descarga a un EC visual, 
pero a no responder-a un segundo estímulo visual sin descarga. Las células locali- 
zadas en la corteza motora tendían a incrementar su tasa de disparo dentro de 
cada ensayo justo antes de la respuesta de evitación y durante su ocurrencia, 
mientras que una falla de estas céjulas para incrementar su tasa de disparo al EC 
significaba generalmente que no se produciría ninguna respuesta. Las células en la 
corteza parietal también tendían a incrementar su tasa de disparo al EC en los en- 
sayos cuando se daba la respuesta, pero no cuando no ocurría al estímulo positivo 
O negativo. 

Estos resultados iniciales dieron lugar a investigaciones más detalladas, en las 
cuales se examinaron otras estructuras cerebrales y arreglos de condicionamien- 
to. Berger y Thompson (19788, 5) han obtenido algunos de los resultados más 
impresionantes. Usaron condicionamiento pavioviano de la membrana nictitante 
("párpado interior””) de un conejo con un EC de tono (sonido), y un soplido como 
El. Se sujeta al animal con correas para impedir que sus movimientos perturben 
los registros eléctricos. En esta preparación, los cambios neurales más interesan- 
tes durante el condicionamiento tienen lugar en las células piramidales en el hipo- 
campo dorsal, Ántes del condicionamiento, estas células no responden al EC del 
tono, y sólo reaccionan débilmente al El del soplido. Sin embargo, después de al 
gunos ensayos de pareamiento EC-El, las células comienzan a incrementar su 
tasa de disparo cuando aparece el El, y la magnitud de este aumento crece de for- 
ma constante a lo largo de los ensayos. Junto con este cambio al ET, la tasa de dis- 
paro incrementada se mueve hacia adelante en el tiempo y ocurre al EC solo en 
anticipación del El. La tasa de disparo hipocampal creciente corresponde muy 
estrechamente a la amplitud en aumento de la RC conductual al EC, con la ex- 
cepción de que los incrementos hipocampales aparecen muchos ensayos des- 
pués de que los cambios conductuales se hacen evidentes. Así, en la detección de 
un efecto inicial del condicionamiento, los registros en el hipocampo son más sen» 
sibles que la respuesta conductual. 

Ena figura 14.10 se muestran las puntuaciones estandarizadas de tasa de dispa- 
ro de las células hipocampales, trazadas sobre bloques de 13 ensayos. A los cone- 
jos experimentales se les daba el EC y el ET pareados en el tiempo, mientras que 
los animales de control recibían presentaciones explícitamente no pareadas del 
tono y el soplido para medir posibles cambios provocados por la sensibilización o el 
pseudocondicionamiento, En la gráfica superior se trazan los disparos aunados de 
las células hipocampales al EJ, mientras que la gráfica inferior ilustra su disparo 
desde el inicio del EC hasta el comienzo del EJ un cuarto de segundo después. De 
la figura 14,10 pueden extraerse varias conclusiones. Primero, el pareamiento 
explícito del EC y del El es necesario para obtener condicionamiento de las res- 
puestas hipocampales (así como también para la respuesta conductual). Segundo, 
los cambios se producen con mayor rapidez para el El que para el EC. Tercero, la 
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dos (El, cuadro superior) y al tono (EC, cuadro inferior] para los conejos que reciben el 
EC y el El, ya sea pareados o no pareados ltomada de Berger y Thompson. 1978a). 


tasa de disparo al EC y al El en los sujetos ““pareados'' está elevada por encima 
de los controles “no pareados”, incluso en el primer bloque de (13) ensayos. Ber- 
ger y Thompson descubrieron diferencias de grupo significativas en el disparo hi- 
pocampal sólo después de uno o dos ensayos pareados; ese es un aprendizaje muy 
rápido, y aparece en el hipocampo muchos ensayos antes de que se presente en 
las RC manifiestas, lo que constituye un claro ejemplo del aprendizaje que tiene 
lugar por debajo de un umbral de respuesta. 
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Á partir de otros datos, Berger y Thompson concluyeron que la latencia y la 
amplitud del incremento hipocampal en el disparo dentro de cada ensayo se corre- 
lacionaba con la latencia y la amplitud de la RC conductual. Así, las tasas de disparo 
de estas células hipocampales parecían estar indexadas a la fuerza de condiciona- 
miento del conejo. Además, durante una serie de ensayos no reforzados (sólo el 
EC), la respuesta neural se extinguía paralelamente a la respuesta del párpado. 

No todas las células piramidales en el hipocampo muestran estos cambios de 
aprendizaje. Las células que cambian (30%) son las que se encuentran en el hipo- 
campo dorsal y proyectan fuera sus axones, a través del fórnix, Berger y Thomp- 
son (1978b) descubrieron que las variaciones similares del aprendizaje podían re- 
gistrarse en las células de la región septal lateral, aunque se demoraba en relación 
con los cambios hipocampales por muchos ensayos. Esto sugiere una proyección 
de los cambios del aprendizaje desde las células hipocampales a través de las vías 
fornicales hasta el septum lateral, No se encontraron tales variaciones en las célu- 
las cercanas en el septum medioni en los núcleos mamilares, medios o laterales. 

Los resultados como los de Berger y Thompson requieren de una cuidadosa in- 
terpretación. En primer lugar, es razonable que se produjesen algunos cambios 
cerebrales correlacionados con la respuesta manifiesta del animal al EC. Como 
mínimo, las células en la corteza motora que controlan la RC manifiesta deben in- 
tervenir necesariamente. El interés de los resultados de Berger y de Thompson 
es que abarcan células de estructuras que no son sensoriales ni motoras. De 
hecho, al hipocampo se le ha implicado a menudo en emociones y en la memoria. 
Un segundo punto a considerar es que el engrama tal vez no resida en las células 
que se registran, sino que es posible que estas células sólo ''escuchen” o 
''retransmitan”” la memoria activada por el EC. Así, el engrama EC-El puede re- 
sidir en el eje cerebral o en una corteza sensorial de asociación (lo cual depende de 
1h complejidad del EC), o ambas cosas, con proyecciones paralelas a través del hi- 
pocampo hasta la corteza motora. 

Independientemente de la exacta interpretación de tales resultados del cambio 
cerebral, éstos sugieren formas interesantes de trazar mapas de los circuitos ce- 
rebrales implicados en el aprendizaje elemental. Estos datos son necesarios para 
desarrollar conjeturas preliminares acerca de la forma en que el cerebro registra 
un conjunto particular de memorias. 


Localización de las memorias 


¿En qué partes del cerebro se almacenan las memorias? Hace un siglo se creía 
que una memoria se almacenaría en un lugar especifico, tal vez en el área de a80- 
ciación vinculada con la corteza sensorial dominante excitada por la experiencia del 
aprendizaje. La hipótesis de localización específica se puso en duda debido a los 
resultados de Karl Lashley (1924, 1950), quien descubrió que una discriminación 
simple de luz-oscuridad o un hábito de laberinto era algo que las ratas podían 
aprender independientemente de las áreas corticales de sus cerebros que se hu- 
biesen extirpado. De modo similar, la remoción de parte de la corteza podía causar 
la pérdida momentánea de un hábito o una discriminación de brillantez previamen- 
te aprendidos, pero a menudo se reentrenaba al hábito con facilidad, a no ser que 
la lesión hubiese dejado ciego al animal. Después de una serie de fracasos para lo- 
calizar un hábito de laberinto y uno de discriminación de la brillantez en el cerebro 
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de la rata, Lashley Vegó a la conclusión de que probablemente una memoria se 
establecía de forma difusa, en todas las regiones de la corteza (o quizás de la sub- 
corteza), que se repite múltiples veces en todas partes, para abarcar un gran nú- 
mero de neuronas. Como resultado, una sola intervendría en muchos miles de 
memorias, y una memoría se representaría mediante un patrón o configuración 
particular de excitación cortical, De este modo, el aprendizaje de un hábito sería 
más lento y más pobre la retención cuanto mayor fuera la cantidad de corteza re- 
movida, pero la remoción de cualquier área debería tener electos equivalentes a 
ua remoción similar en otra región del mismo tamaño. Para los neuropsicólogos, 
estas opiniones acerca del carácter difuso de la huella de la memoria eran especial- 
mente desalentadoras. 

Sin embargo, a la luz de resultados posteriores, las conclusiones de Lashley pa- 
recen reducirse a los mamiferos inferiores y a los hábitos de laberinto simple me- 
didos con instrumentos burdos. Lashley empleaba discriminaciones muy simples 
de brillantez o de espacio, y parece probable que éstas sean adquiridas por los cir- 
cuitos subcorticales solos, quizá con la participación del genículo lateral (para la vi- 
sión), el eje cerebral y el hipocampo. Sin embargo, un aprendizaje razonablemente 
complejo, que implica diversos componentes, discriminaciones difíciles o patrones 
configurales complejos, parece requerir de áreas de asociación cortical “supe- 
nores””. Estas conclusiones se desprenden del examen de los efectos de las lesio- 
nes cerebrales en los seres humanos, simios y chimpancés. Evidencia reciente su- 
giere una considerable localización de funciones complejas (por ejemplo, capacidad 
lingúística y musical), de habilidades cognoscitivas, y de memorias complejas en 
los animales superiores. Hoy en día, la mejor hipótesis es probablemente una ver- 
sión modificada de la teoría antigua, según la cual una memoria compleja se locali- 
za en la corteza de asociación conectada a la corteza sensorial que predominaba 
durante la experiencia del aprendizaje. En el caso de que participen varias modali- 
dades sensoriales (correlación del tacto con la visión), las fibras que vinculan a las 
dos cortezas de asociación también intervendrán en la memoria, Además, en el 
caso de que intervengan moyimientos, la memoria en la corteza de asociación es- 
tará vinculada con las regiones de la corteza motora. 

El apoyo para la hipótesis de la memoria localizada proviene de muchos estudios, 
en particular de las finciones cognoscitivas (como el habla) en los seres humanos, 
y del aprendizaje de patrón visual en los primates. Moviéndose hacia adentro a 
partir de la retina, el sistema visual del primate consta a grandes rasgos del 
genículo lateral, la corteza estriada en la parte trasera del cerebro, la zona ctrcu- 
mestriada, y la corteza inferotemporal (asociación visual). Las discriminaciones vi- 
suales simples como la de luz versus oscuridad pueden aprenderse sin ninguna corte- 
za; pero cuanto inás complejos o configurados sean los patrones de estímulo a 
discriminar, habrá más probabilidades de que se requieran niveles '“superiores”” 
(más tardios) del sistema de análisis visual para que pueda producirse el aprendi 
zaje. Es razonable conjeturar que el reconocimiento de una clase particular de 
estímulos visuales (como el rostro de la madre de usted) se establece primero me- 
diante una reunión o red de células en la corteza inferotemporal. Por ejemplo, 
Gross (1973) descubrió células inferotemporales en el cerebro de un mono que 
respondían al máximo a patrones muy complejos, como la mano de un simio, un 
cepillo o unas tijeras. Esto hace admisible a la idea de que los patrones visuales 
tienen representaciones discretas y locales en grupos de células corticales. 
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Muchos teóricos han propuesto que el sistema visual está jerárquicamente or- 
ganizado, con gran número de sistemas neuronales de detección con caracte- 
rísticas de bajo nivel agrupados en características significativas (como líneas 
bordes, ángulos), que entonces se configuran en patrones de nivel todavía más 
alto, a medida que el estímulo sigue su curso hacia adentro y se le analiza aún más 
(véase Hubel y Wiesel, 1962). La teoría de Wickelgren de la asociación cortical 
era de este tipo, y el diagrama esquemático que aparece en la figura 14.11 recor- 
dará al lector las ideas básicas. La estimulación visual se codifica en la retina y el 
genículo lateral, y excita un cierto número de células de ““característica”* en la 
corteza estriada (aquí denominadas a, b, c), que convergen o Se intersecan poste- 
riormente en una célula sintetizadora de patrón (o grupo de células) en la corteza 
inferotemporal. Supóngase que un reforzamiento concurrente en el hipocampo 
(sistema límbico) hace que las células se agrupen activamente en ese momento 
para convertirse en bloques en la configuración mostrada. Esta formación de blo- 
ques se lleva a cabo básicamente mediante la asociación de las características de 
nivel inferior con el nodo de bloque, tal vez al disminuir los umbrales de conduc- 
ción para estas vías. La célula X (o grupo de células) en la corteza inferotemporal 
representaría entonces al patrón de estímulo (a, b, c). Cabe suponer que la célula 
X actúa exactamente como bloque o nodo asociativo en una red de memoria (véanse 
Anderson y Bower, 1973; Wickelgren, 1979a). En particular, la posterior acti- 
vación de un fragmento del patrón (como los segmentos a y 6) puede activar la cé- 
lula de patrón X, que mediante las asociaciones causa la activación en sentido des- 
cendente de la porción ausente (c) del patrón. Por ejemplo, el ver la mitad del 
rostro cubierto de un amigo podría conducir a la excitación de la célula patrón de 
su rostro, que activa células inferiores que codifican las características no vistas, 
lo cual estimula la imaginación visual y las expectativas. De hecho, a la célula de 
bloque patrón se le han asignado aquí todas las propiedades del vínculo asociativo; 
es decir, se comporta como un centro interruptor que agrupa entradas (como los 
EC) y las conecta con las salidas (RC). Así, el nodo para el rostro del amigo se 
conectaría con la corteza verbal motora, de modo que pudiera darse el nombre de 
esa persona. En muchos experimentos, el aprendizaje del patrón de estímulo- 
respuesta-recompensa se indica principalmente por la ejecución de la respuesta 
motora. 

Aunque se ha ilustrado la hipotética idea del bloque para patrones visuales, se 
aplicaría también a los patrones auditivos, los somestésicos, etcétera. Además, el 
mecanismo de asociación permite asociaciones transmodales, de manera que un 
nodo de concepto visual pudiera conectarse con un nodo de concepto táctil o audi- 
tivo. Los seres humanos son expertos en esas asociaciones transmodales, en es- 
pecial aquellas que apoyan al lenguaje, que correlacionan la visión de palabras y ob- 
jetos, sonidos, y producción del habla. 

Este bosquejo genera! de un modelo de bloque del aprendizaje de patrón es si- 
núlar a la teoría de D. O. Hebb (1949) de la formación de los grupos de células, y la 
construcción de grupos de células en secuencias de fase regular (series aprendi- 
das de patrones o de movimientos). Aunque muy plausibles, los mecanismos son 
en gran parte conceptuales y conjeturales, y en realidad no se han identificado. 
Pero incluso una teoría incompleta como ésta puede guiar al investigador del ce- 
rebro y ayudar a los estudiantes a organizar el material, Indudablemente, el 
sustrato fisiológico real de un circuito aprendido resultará mucho más complejo. 
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La investigación acerca de la localización de las huellas de la memoria fue fomen- 
tada por el trabajo de Roger Sperry y sus colegas en torno de la transferencia del 
aprendizaje entre los dos hemisferios cerebrales. A continuación reseñaremos 
este importante estudio. 


DOS CABEZAS EN UN CRÁNEO: TRANSFERENCIA 
INTERHEMISFERICA 


Una de las características más sorprendentes en el cerebro de los vertebrados 
es su simetría bilateral. Las estructuras del cerebro están duplicadas casi a la per- 
fección en posiciones homólogas en torno de la línea media del plano sagital (es de- 
cir, el plano que corta la mitad anterior y la posterior, desde la parte superior de la 
cabeza hasta el mentón). Esta representación bilateral de la función plantea intere- 
santes posibilidades de investigación encaminadas a la localización de la huella de la 
memoria. 

Para ver algunas de las posibilidades, considérese el carácter bilateral del siste- 
ma visual de los mamiferos (véase la figura 14,12). La retina de cada ojo capta la 
información visual y la transmite por tractos ópticos distintos. Estos se unen en 
una coyuntura denominada quiasma óptico, Después de la coyuntura, los tractos 
vuelven a separarse: el de la izquierda pasa por varias estaciones de relevo para 
proyectarse en el hemisferio cerebral izquierdo; el derecho avanza de modo pare- 
cido y se proyecta en el hemisferio cerebral derecho. En el quiasma hay un no- 
table entrecruzamiento de las fibras de los dos tractos que en él penetran; aproxi- 
madamente la mitad de cada tracto cruza al opuesto al salir de la coyuntura del 
quiasma, Las fibras que cruzan son aquellas que se originan principalmente en la 
mitad de la retina más cercana a la nariz. Por este entrecruzamiento que se produ- 
ce en el quiasma, la información que proviene del lado de la nariz de la retina iz- 
quierda se proyecta principalmente a la corteza derecha; mientras que la informa- 
ción procedente de la parte lateral de la retina izquierda se proyecta a la corteza 
izquierda. Pasando la corteza cerebral, los dos hemisferios están en comunicación 
directa a través de una serie de comisuras, que son los haces de fibras que conec- 
tan las estructuras homólogas de ambos lados. La más larga de estas comisuras de 
conexión es el curerpo calloso, un haz de fibras masivas que interrelaciona muchas 
partes de los dos hemisferios, 


Transferencia interocular y su eliminación quirúrgica 


Luego de estas consideraciones de índole anatómica, analizaremos el fenómeno 
de la transferencia interocular de una discriminación visual que ha aprendido un 
animal (un gato o un mono) usando un solo ojo. Se obliga al animal, tapándole 
un ojo, con un lente de contacto a que aprenda una discriminación visual con un 
solo ojo (el otro nunca ve el estímulo discriminativo). Después de este aprendizaje 
se le aplica una prueba con el ojo opuesto abierto y el entrenado cubierto. En cir- 
cunstancias normales, presentará una transferencia prácticamente perfecta del 
hábito, del ojo entrenado al no entrenado. Una serie de experimentos de Sperry 
(1961) y sus colaboradores permite suponer que en este caso el conocimiento vi- 
sual (o engrama) que interviene en la ejecución discriminativa se ha guardado en 
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ambos hemisferios durante el entrenamiento, y que en el transcurso de la prueba 
con el ojo no entrenado, sus conexiones aferentes con el cerebro hacen contacto con 
uo o ambos hemisferios entrenados; así, recupera y usa el engrama para guiar las 
respuestas correctas. 

Empezaremos por rastrear las pruebas sistemáticas que apoyan esta interpreta- 
ción. Considérese primero el efecto de cortar el quiasma óptico por el plano sagital 
(como se ve en la figura 14.12), de modo que cada ojo se proyecte solamente a su 
corteza visual correspondiente en el mismo Jado. Este corte de quiasma produce 
una hemianopia, que significa que cuando sólo se utiliza un ojo, casi la mitad del 
campo visual (el borde periférico que se proyecta del lado de la nariz de la retina) 
se ve borrosa, aunque todo puede verse con claridad al mover el ojo. Y, cosa 
extraña, cortar el quiasma de este modo no afecta la transferencia interocular, in- 
dependientemente de que tal corte se haga antes o después de entrenar a un ojo 
determinado, Aunque el entrenamiento tiene una entrada visual limitada hacia, por 


Figura 14.12. Repre 
sentación esque- 
mática del sistema 
visual que muestra 
la retina, el quiasma 
óptico y las proyec- 
ciones a las áreas de 
recepción visual 
de la corteza cere- 
bral. En la figura se 
ha seccionado el 
quiasma óptico, con 
lo cual se elimina 
la mitad del «ampo 
visual, que narmal- 
mente se transmite 
por las fibras entre- 
cruzadas, proceden- 
tes del ojo opuesto, 
hacia uno de los he- 
misferios cerebra- 
les, La afluencia vi- 
sual que procede de 
cadá Ojo se restrin- 
ge al hemisferio que 
corresponde al mis- 
mo lado de cada ojo 
El cuerpo calloso 
aparece intacto 


x A pao [tomada de Sperry, 
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ejemplo, el hemisferio izquierdo, si se hacen pruebas posteriores con el ojo de- 
recho (que se proyecta hacia el hemisferio derecho) se descubre que la informa- 
ción que va por ese canal de algún modo entra en contacto con el engrama. 

Este contacto del ojo derecho con el engrama es posible de una de dos formas, 
Una es que el engrama se guarde sólo en el hemisferio izquierdo que recibe la 
entrada sensorial directa durante el entrenamiento. Sin embargo, el ojo derecho y 
el hemisferio derecho pueden emplear este engrama en el curso de la prueba, en 
virtud de que las redes de comunicación callosas conectan a dos dos hemisferios. La 
otra posibilidad es que aunque el engrama primario se esté estableciendo en el he- 
misferio izquierdo durante el entrenamiento, las conexiones que se llevan a cabo 
por medio del cuerpo calloso permiten que al mismo tiempo se haga un duplicado o 
copia al carbón del engrama que se guarda en el hemisferio derecho. Entonces, las 
pruebas posteriores que se le aplican al ojo derecho usarían esta copia del engra- 
má que se ha establecido en el hemisferio derecho. 

Hay dos experimentos que señalan que esta opción posiblemente es la correcta. 
Supóngase que después de entrenar con el ojo izquierdo a un gato con el guiasma 
seccionado extirpamos la corteza visual del lado izquierdo. Según el enfoque ante- 
rior, esto haría imposible la ejecución usando el ojo derecho, porque la “fuente infor- 
mada'” ya no puede proporcionar información al hemisferio derecho ingenuo. 
Pero, de hecho, se encuentra que los animales asf tratados todavía tienen una 
transferencia sustancial cuando se aplica una prueba al ojo derecho. En el segundo 
experimento, se corta el cuerpo calloso después de entrenar al animal sólo con el 
ojo izquierdo y con el quiasma seccionado. Esto debería interrumprr las líneas de 
comunicación de manera que, con base en el primer enfoque, no cabría esperar 
ninguna transferencia al aplicar pruebas usando el ojo derecho; sin embargo, se 
encuentra dicha transferencia. A partir de estos experimentos inferimos que la co- 
pia duplicada del engrama se establece por lo regular a través del cuerpo calloso, 
en el momento de entrenar a un animal sólo con el ojo izquierdo y con el quiasma 
seccionado. 

Con estos hechos a su alcance, el lector puede suponer qué debe hacerse para 
eliminar Ja transferencia interocular. Desde luego, una operación eficaz sería cor- 
tar el quiasma y el cuerpo calloso antes de empezar el entrenamiento visual con un 
ojo. Y, de hecho, esta doble operación prácticamente elimina la transferencia in- 
terocular; el ojo y el hemisferio que no ven siguen desconociendo el problema vi- 
sua) que ha aprendido el ojo entrenado. Esta preparación quirúrgica, denominada 
cerebro dividido, en apariencia establece dos sistemas visuales independientes, 
uno a cada lado del cerebro, y los dos dejan de comunicarse entre sí. Por ejemplo, 
al cubrir sucesivamente uno y otro ojo, es fácil entrenar al animal en hábitos 
conflictivos para los dos ojos; en un caso, a escoger las rayas verticales y evitar las 
horizontales cuando las ve con el ojo izquierdo; en el otro, a hacer lo contrario 
cuando ve con el ojo derecho. Este entrenamiento conflictivo es sumamente difícil 
en el animal normal intacto, pero el gato o el simio con el cerebro dividido lo apren- 
den con facilidad. Al parecer, para obtener esta notable independencia de los sis- 
temas visuales deben cortarse todas las fibras del cuerpo calloso. Si se escapa 
incluso uma breve porción de fibras callosas, de cualquier modo habrá transferencia. 

En la transferencia de una discriminación de tacto de una mano a la otra se han 
obtenido resultados un tanto parecidos, aunque hay varias diferencias importantes 
en comparación con el sistema visual. Una discriminación de tacto (la superfide 
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áspera o lisa de algunos objetos) que se ha aprendido con la mano derecha se 
transferirá normalmente a la mano izquierda. Sin embargo, si se corta el cuerpo 
calloso antes del entrenamiento con una mano, se elimina la transferencia entre 
ambas. Esto concuerda con las pruebas anatómicas que demuestran que la mayor 
parte de las líneas de entrada somestésica se cruzan en la parte media y se pro- 
yectan en el hemisferio contralateral (es decir, el tacto de la mano izquierda se 
proyecta a la corteza derecha). 

La transferencia interhemisférica examinada implica en cada caso una respuesta 
instrumental activa, que a menudo está bajo el control de un estímulo discriminati- 
vorelativamente complejo. Hay alguna evidencia de que las reacciones emociona- 
les condicionadas (temor), en especial aquellas instigadas por un estímulo simple 
(por ejemplo, un cambio en la brillantez), pueden aprenderse subcorticalmente. 
Los animales aprenden esas RC a pesar de la remoción de ambos hemisferios, lo 
cual sugiere que la sección del cuerpo calloso no impide la transferencia de tales 
*“emociones”” condicionadas clásicamente (véase McCleary, 1960). Se sabe tam- 
bién que pueden aprenderse subcorticalmente discriminaciones instrumentales 
simples de brillantez, sin que se beneficie la corteza. En consecuencia, no €s 
sorprendente encontrar esa transferencia de hábitos entre los ojos, a pesar de ha- 
ber cortado el quiasma y el cuerpo calloso antes del entrenamiento con un ojo 
(Meikle, 1960; Meikle y Sechzer, 1960). Así, la ausencia notoria de transferencia 
cuando se ha efectuado el corte del cuerpo calloso sólo se tendrá en aquellos hábi- 
tos relativamente más complejos que dependen del funcionamiento de la corteza 
cerebral. Esta es una pequeña restricción de la generalidad de los resultados, que 
de ninguna manera es significativa. Nos dice que los concomitantes emocionales de 
las respuestas instrumentales aprendidas se representan subcorticalmente, mien- 
tras que es probable que los “conocimientos”? refinados que guían a la respuesta 
selectiva se almacenen en la corteza, 

La preparación del cerebro dividido ha iluminado muchos hechos acerca de la bi- 
lateralidad del almacenamiento que se lleva a cabo en los sistemas visual y somes- 
tésico, y acerca del importante papel que desempeña el cuerpo calloso al propor- 
cionar las conexiones que permiten hacer una **copia al carbón''. Además, Sperry 
(1961) señala las numerosas ventajas de la preparación del cerebro dividido en la 
investigación de muchos problemas de las funciones cerebrales. De este modo, 
una mitad del cerebro puede servir de control efectivo cuando las lesiones o 
traumas similares incapacitan parcialmente a la otra mitad. Pero los procedimien- 
tos quirúrgicos radicales sólo pueden llevarse a cabo en un lado del cerebro, pues- 
to que cuando se realizan en ambos quizá se incapacite seriamente al animal para 
que sirva como sujeto experimental, Sperry describe varias formas nuevas e inge- 
niosas de usar esta preparación del cerebro dividido en la investigación de proble- 
mas relativos a la manera en que el cerebro funciona en la ancianidad. 


Seres humanos con el cerebro dividido 


Gazzaniga (1967, 1970, 1972), y Gazzaniga y Sperry (1967) investigaron defi- 
ciencias conductuales en varios pacientes humanos a quienes se les ha extirpado 
quirúrgicamente casi todo el cuerpo calloso a fin de remediar la epilepsia severa, 
En un volumen de Gazzaniga y LeDoux (1977) aparece una síntesis de esta línea 
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de investigación. En los problemas visuales a que se enfrentan en la vida cotidiana, 
los pacientes parecen desempeñarse adecuadamente; pero esto se debe a que son 
capaces de mover ambos ojos repetidas veces sabre cualquier estímulo visual 
dado. 

Para detectar el déficit especial de estos pacientes, Gazzaniga y Sperry 
hacían destellar estímulos visuales por una fracción de segundo, proyectados a la 
izquierda (o derecha) del campo visual. Notése que en los sujetos con el cerebro 
dividido, un estímulo que destella al campo visual izquierdo será retransmitido 
principalmente a la corteza (hemisferio) derecha, mientras que los que aparecen 
en el campo derecho van a la corteza izquierda (véase la figura 14.12). Este proce» 
dimiento de destello se empleaba para ““confinar”* el ingreso de un estímulo visual 
al hemisferio cerebral izquierdo o derecho. Una serie de pruebas dirigidas por 
Gazzaniga y Sperry muestran que en los pacientes con el cerebro dividido el he- 
misterio cerebral izquierdo está relativamente especializado en el habla activa (leer, 
hablar, escribir), mientras que el derecho se especializa más en la percepción no 
verbal y el razonamiento espacial. El hernisferio izquierdo puede leer palabras y 
actuar por órdenes impresas, ya sea al hablar o al usar la mano derecha para selec- 
cionar objetos nombrados mediante el tacto. (Recuérdese que la mano está bajo 
el control de su hemisferio cortical opuesto.) Sin embargo, en estos pacientes el he- 
misterio derecho parece incapaz de decir qué palabra o imagen se le ha mostrado 
con gran rapidez; por lo general el sujeto afirma que no vio nada, o quizás sólo un 
“destello”. Sin embargo, si se le obbga a seleccionar una palabra entre un conjun- 
to de prueba, infaliblemente escogerá el reactivo correcto, a pesar de su incapaci- 
dad inicial para mencionar el nombre del mismo (Gazzaniga, 1970, 1972). Además, 
la palabra proyectada al hemisferio derecho puede incluso guiar una búsqueda tác- 
til (con la mano izquierda) del objeto correcto (por ejemplo, una cuchara) entre una 
colección de objetos ocultos a la vista del sujeto. Incluso después de tomar con la 
mano izquierda el objeto correspondiente a la palabra destellada, el hemisferio de- 
recho es incapaz de verbalizar el nombre del objeto. 

Tales observaciones sugieren que el hemisferio derecho tiene una capacidad im- 
perfecta para el reconocimiento y la comprehensión (verbal) visual pasiva; su com- 
prehensión, de hecho, parece mejor con imágenes, después con sustantivos 
concretos; es deficiente con verbos, y más aún con sustantivos abstractos deriva- 
dos de verbos (por ejemplo, pintor, bailarín). Las observaciones también 
muestran una curiosa forma de conciencia dividida, o disociación. En un nivel de 
conocimiento, la persona es incapaz de decir qué objeto de prueba va a escoger; 
sin embargo, en otro nivel, infaliblemente selecciona el objeto correcto con su 
mano izquierda valiéndose sólo del tacto. Así, dos índices conductuales del ““esta- 
do consciente”, o control de estímulo, han sido disociados de modo efectivo por el 
procedimiento del cerebro dividido. La naturaleza paradójica de la ejecución diso- 
ciada reside en la ambigúiedad del términa '*conciencia””;, decimos que alguien es 
“consciente de”* un estimulo (evento o estado de cosas) si puede etiguetarlo ver- 
balmente o si se comporta de una forma que muestre que ''tiene en cuenta” ese 
evento. 

Por ejemplo, una persona absorta en una conversación o en un programa 
de radio mientras conduce un automóvil, es consciente de las señales de curvas y de 
alto al costado del camino en el segundo sentido, pero no en el primero. La dt 
ferencia entre tal caso común y el del paciente con el cerebro dividida es que éste 
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parece casi incapaz de “ser consciente'* en el sentido del habla, de un patrón de 
estímulo proyectado sólo en su hemisferio cerebral derecho. 

Aunque un tanto deficiente en el habla activa, el hemisferio cerebral derecho pa- 
rece más especializado en manejar información no verbal, como figuras espaciales 
o geométricas, o melodías. Por ejemplo, la mano izquierda (controlada por el he- 
misterio derecho) es mejor que la derecha para encontrar soluciones a rompeca- 
bezas que requieran del razonamiento espacial, o para reconstruir las partes de 
una escena de bloques, etcétera. Una variedad de evidencias sugiere que en el ser 
humano, los hemisferios izquierdo y derecho, se especializan relativamente en 
percibir, utilizar y almacenar información verbal y no verbal (analógica e imaginati- 
va, respectivamente). Un estudio de Galin y Orustein (1972) demostró que había 
una actividad EEG relativamente mayor en el hemisferio izquierdo que en el de- 
recho cuando una persona trabajaba en una tarea verbal (como escribir una carta), 
pero que la actividad relativa (EEG en los dos hemisferios se invertía si el sujeto 
realizaba una tarea que necesitara de imaginería mental. Se observan diferencias 
similares en los EEG específicos del hemisferio para la aritmética mental (hemis- 
terio izquierdo) en contraposición al fantaseo (derecho), y para la lectura de prosa 
científica abstracta versus nasraciones concretas. 

A lo largo de otras líneas, los artículos de Kimura (1963) y de Miner (1968) in- 
forman que los pacientes con lesión cerebral en la corteza temporal izquierda 
muestran déficit selectivos en las tareas de memoria verbal pero no en las no ver- 
bajes, mientras que los pacientes con lesión en el lóbulo temporal derecho tienen 
deficiencias en la memoria no verbal pero no en la verbal. La memoria no verbal se 
sometió a priveba mediante el reconocimiento o el recuerdo de ilustraciones o 
melodías previamente presentadas; la memoria verbal se comprobó mediante el 
reconocimiento o el recuerdo de números, palabras y pares de palabras. Otro co- 
mentario acerca de la especialización lateral es que en los niños que usan la mano 
derecha el habla activa se desarrolla principalmente en el hemisferio izquierdo (el 
patrón es menos claro para aquellos que utilizan la mano izquierda). Si el hemisfe- 
rio izquierdo sufre una lesión severa antes de la edad de 8 a 14 años (la edad crítica 
exacta es motivo de polémica); el niño, sin embargo, retiene el habla adecuada, 
pero ésta se representa ahora en el hemisferio derecho. No obstante, si la lesión 
en el hemisferio izquierdo se produce después de la edad crítica, el habla se ve 
muy perturbada y, según el grado de la lesión, sólo podrá tener lugar una recupe- 
ración insignificante de tales funciones. (Lenneberg, 1967), En sus diferentes a)- 
cances, estas lesiones cerebrales son responsables de las diversas afasias del len- 
guaje. 

Una causa común de afasias pequeñas y localizadas es la apoplejía, aunque 
el daño ocasionado en estos casos no suele ser tan severo como para evitar la re- 
cuperación del habla normal con otras partes del cerebro. 

Toda esta línea de evidencia parece integrarse en un conjunto razonablemente 
ordenado. Ahora se sabe bastante acerca de los dos hemisferios cerebrales, qué 
funciones especializadas cumplen, y cómo tienden a comunicarse entre sí. A partir 
de la preparación elemental del cerebro dividido de Sperry en esta área se han 
hecho muchos progresos. Este ilustra la forma en que un resultado fisiológico se 
ramiica en múltiples estudios psicológicos (independientemente de la lateraliza- 
ción de la función), y puede revelar resultados que esclarezcan problemas funda- 
mentales relacionados con la experiencia perceptual y la conciencia. 
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Disociación química de los hemisferios cerebrales 


Bures y Buresová (1960) y Bures y asociados (1964) han utilizado una técnica 
denominada depresión difundida, mediante la cual podemos alterar temporalmente 
el funcionamiento normal de un hemisferio cerebral. Esta técnica produce un ani- 
mal que tiene medio cerebro durante unas cuantas horas antes de que se recupere 
de l depresión difundida. Para lograr este efecto se aplica localmente una pe- 
queña cantidad de cloruro de potasio a través de un diminuto orificio practicado en 
el cráneo, para pasar a la duramadre que circunda a la corteza. En poco tiempo se 
deprime la actividad eléctrica normal del hemisferio de la corteza así tratado. La 
depresión persiste aproximadamente tanto tiempo como el que dure la aplicación de 
la solución química. Cuando ésta se retira, la actividad eléctrica normal del hemis- 
ferio deprimido se restaura muy pronto. En la rata, la depresión sólo se difunde en 
la corteza en la cual se ha aplicado la sustancia química. El efecto no es el de un 
anestésico, pues el animal se mueve normalmente aunque sus dos hemisferios es- 
ten deprimidos. Sin embargo. es probable que experimente cierto entorpeci- 
miento y parálisis parcial de las patas contralaterales a cada hemisferio deprimido. 
No obstante, el resultado de Bures es de gran interés; de acuerdo con sus hallaz- 
gos, mientras un hemisferio está deprimido no da ninguna señal de haber retenido 
los hábitos que aprendió cuando estaba intacto. La depresión de algún modo ha 
bloqueado el acceso al engrama. También es interesante el hecho de que un ani- 
mal, cuya corteza aparentemente funciona con normalidad, no recuerda los eventos 
que ocurrieron cuando dicha corteza estaba deprimida. 

La demostración más simple de esto es la ausencia de transferencia interhemis- 
férica de un hábito aprendido. En el día 1 se enseña a una rata un hábito de evita- 
ción simple con luz y descarga mientras tiene, por ejemplo, el hemisferio derecho 
deprimido. En el día 2 se le aplica una prueba mientras tiene deprimido el hemisfe- 
ria derecho o el izquierdo. Si el mismo hemisterio funciona ambos días, entonces 
el animal muestra haber retenido el hábito; si en los dos días funciona un hemisfe- 
rio distinto, muestra poca o ninguna retención; 1. S, Russell y Ochs (1961) infor- 
man de resultados similares al enseñar a unas ratas el hábito de apretar una palan- 
ca, con comida como recompensa. Aparentemente, el hemisferio que funciona 
durante la sesión de entrenamiento almacena el engrama, mientras que el hemis- 
ferio deprimido sigue siendo ingenuo. Al siguiente día de prueba, cuando se depri- 
me el hemisferio entrenado, la corteza que funciona (pero que es ingenua) no tiene 
acceso al engrama almacenado en el lado deprimido. Como sucede con el mono 
que tiene el cerebro dividido, también es posible —al deprimir alternadamente uno 
y otro hemisferio — enseñar a los dos hemisferios hábitos conflictivos de estímulo y 
respuesta, y no se produce ninguna interferencia entre los dos lados y sus hábitos 
conflictivos. 

Estas consideraciones nos conducen a una inquietante pregunta: ¿por qué el he- 
misferio educado no transfiere su engrama (por medio de las conexiones callosas) 
al hemisferio no educado, después de que se ha disipado la depresión y mientras la 
rata se encuentra en su jaula? La falta de transferencia interhemisférica demuestra 
que esto no sucede. Sin embargo, resulta que se produce algo parecido a esta 
“tutela por medio del cuerpo calloso'”, si se vuelve a colocar a la rata en la si- 
tuación de aprendizaje y experimenta unos cuantos ensayos mientras ambos he- 
misferios funcionan. Russell y Ochs (1961) informaron que un ensayo basta para 
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producir sustancialmente una tutela a través del cuerpo calloso del lado no educa- 
do. Travis (1964) encontró —cosa menos notable—- que se necesitaban de 4a 5 
ensayos para lograr una adecuada transferencia de un hábito bien aprendido. Es- 
tos resultados indican que Ja estimulación que se dio en la situación de aprendizaje 
reactivó el engrama de la corteza educada, estableciendo una huella de actividad 
persistente; el engrama se comunicó con el otro hemisferio y se cunsolidó en él 
por medio de los vínculos callosos. 

Sin embargo, Schneider (1967, 1968) ofrece una explicación más parsimoniosa 
deestos diversos resultados con la depresión difundida; es decir, la generalización 
del estímulo condicionado. Se presume que el ““estado'” de depresión difundida 
que prevalece durante el entrenamiento original (el hemisferio izquierdo, el de- 
recho, ninguno, o ambos deprimidos) (7, D, No A constituye parte del complejo 
total de estimulo al cual se asocia la respuesta. Los componentes periféricos más 
obvios de los estados corticales deprimidos son un ligero entorpecimiento y paráli- 
sis de los miembros en el Jado contrario al hemisferio deprimido. Podemos pensar 
en la similitud de dos estados cerebrales en el sentido de que está determinada 
por la superposición en ninguno, uno o dos hemisferios que se encuentran en la 
misma condición normal o deprimida. Así, el estado normal es equidistante del es- 
tado en que e) hemisferio derecho o el izquierdo está deprimido, pero más alejado 
del estado en el cual ambos lo están. De modo similar, la condición de depresión 
izquierda está más alejada de la depresión derecha pero cercana a la de depresión 
en ambos hemisferios, que a la condición de ninguna depresión, En esta perapecti- 
va, cuando al anima) se Je somete a prueba en un diferente estado cerebral, el há- 
bito sufre un “decremento de generalización del estímulo'” debido a los estímulos 
cambiados internos y contextuales. Mientras mayor sea el cambio en la cantidad 
de depresión desde la adquisición a la retención, mayor será la perturbación de la 
ejecución en Ja prueba, hecho éste que se encuentra bien documentado. Schneider 
descubrió, por ejemplo, que Jos animales entrenados cuando su hemisferio iz- 
quierdo (7) estaba deprimido mostraban mayor retención si se les sometía a 
prueba en el estado 1, su retención disminuía en el estado A, después en el N, y 
por último en el £). Este orden difiere de lo que cabe esperar de acuerdo con la hi- 
pótesis alternativa, según la cual el hábito original se confina al hemisferio derecho 
y está disponible para recuperación cuando ese hemisferio es normal. Un segundo 
hecho relacionado con la hipótesis del control del estímulo es que a los animales se 
les entrena eficientemente para una discriminación operante, para la cual el 
estímulo discriminativo es la presencia (en contraposición a la ausencia) de depre- 
sión difundida unilateral. 

Schneider explica los resultados de la “transferencia del hábito” de TI. S, Rus- 
sell y Ochs (1961) y de Travis (1964) en términos de nueva adquisición, durante el 
llamado ensayo de transferencia. Según esta opinión, la relación importante se es- 
tablece entre los estados cerebrales en la transferencia y los ensayos de prueba 
de retención; cuanto más similares sean, más generalización del estímulo entre los 
dos hemisferios acrecentará el ensayo único de transferencia. Para comprobar 
esta predicción, Schneider y Ebbeson (1967) repitieron el estudio de Russell y 
Ochs con una condición extra en el ensayo de transferencia. Después del entrena- 
miento en opresión de palanca con el hemisferio izquierdo Y deprimido, el ensayo 
de transferencia tenía lugar sin ningún hemisferio deprimido (WM) o con el hemisfe- 
rio derecho deprimido (2D), y la retención posterior de ambos grupos se compro- 
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baba con el hemisferio derecho deprimido (D). Los resultados mostraron que el 
ensayo único de transferencia producía transferencia posterior interhemisférica 
significativa de la opresión de palanca para ambos grupos. Como era de esperar 
por el argumento del control de estímulo, el grupo que efectuaba el ensayo de 
transferencia en el estado D exhibía mayor transferencia a la situación posterior 
de prueba /), que el grupo que recibía dicho ensayo en el estado N. La hipótesis 
alternativa de que el hábito original estaba confinado al hemisferio derecho no 
deprimido carece de argumentos para explicar por qué es mejor la transferencia 
del hábito al hemisferio no entrenado cuando el entrenado está deptimido, lo cual 
debería inhibir la recuperación del hábito y bloquear su transmisión interhemisférica. 

Estos y otros resultados proporcionan un apoyo rmy convincente a la teoría de 
control de estímulo, de Schneider, de los efectos debidos a la depresión de difu- 
sión cortical. La teoría es parsimoniosa en el uso de conceptos familiares, también 
es intuitivamente satisfactoria, ya que elimina parte del místico temor que rodea a 
los informes iniciales acerca de los estados disociados de conciencia producidos 
por la depresión difundida. Aunque Schneider supone que ésta altera el lugar fi- 
siológico del almacenamiento de engrama (desde los mecanismos corticales a los 
subcorticales en el lado deprimido), su hipótesis se comprende con facilidad en 
términos puramente psicológicos. Un segundo efecto de la depresión difundida, 
que no examinamos aquí, es que puede usarse, al igua] que la descarga electrocon- 
vulsiva, como un medio para interrumpir la consolidación de anteriores experien: 
das de aprendizaje (véase Albert, 1966). En nuestra opinión, no es necesario ana- 
lizar aquí esa línea de investigación. 


Disociación inducida por drogas 


En la preparación del cerebro dividido hemos logrado disociar varias partes del 
cerebro. En términos metafóricos, mediante la disociación se les obliga a tener v+ 
das separadas, se educan en distintas escuelas y tienen personalidades diferentes. 
En una interesante serie de estudios con drogas, a partir de las observaciones con 
el curare de Girden y Culler (1937), se ha informado de un efecto relacionado de 
disociación o efecto de personalidad dividida. Los experimentos posteriores 
de Overton (1964) han mostrado el efecto de forma inpresionante, al usar una dro- 
ga distinta y someter a prueba una conducta más interesante, Revisaremos a 
grandes rasgos algunas características de su trabajo. 

Overton descubrió que el pentobarbital sódico produce disociación en las ratas. 
Esta droga, parecida a lo que popularmente se conoce como '“suero de la 
verdad”, es anestésica y, en dosis suficientes, hace dormir a la rata. Dependiendo 
de la fuerza de la dosis, el animal comenzará a despertar y a movefse de 15 a 45 
minutos después de la inyección. En ese momento puede hacerse que el animal 
ejecute varias tareas de aprendizaje; aunque un poco letárgico, aprende tareas 
simples como dar vuelta a la izquierda en un laberinto 7 para escapar a la descarga 
que se le aplica en las patas a través de un piso enrejado. 

Overton informó que los hábitos aprendidos durante este estado no se trans- 
fieren al estado no drogado, aunque el hábito puede reactivarse después de dro- 
gar nuevamente al animal. La disociación funciona también en la dirección opuesta: 
un hábito aprendido no estando drogado no es asequible al sujeto mientras se 
encuentra drogado. Así, los hábitos son específicos al estado drogado. Al sumi- 
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nistrar y retirar la droga en días alternados, Overton entrenó a sus ratas para que 
dieran vuelta a la izquierda a fin de escapar del choque cuando estaban drogadas, y 
a dar vuelta a la derecha cuando no lo estaban. Esta técnica, llamada entrenamien- 
to en discriminación de droga, es una de las formas más confiables de estudiar la 
disociación entre los hábitos aprendidos en los estados drogado y no drogado, En 
el estudio de Overton, los dos hábitos se aprendían con rapidez y de modo inde- 
pendiente, con poca o ninguna interferencia “encontrada” entre ambos estados. 
Overton demostró que la completa disociación es sólo el polo extremo de un conti- 
nuo graduado. Pudo obtener disociación en mayor o menor grado según la canti- 
dad de droga suministrada, y las dosis mayores producían un mayor grado de diso- 
ciación, 

Desde los experimentos iniciales de Overton, la discriminación de droga se ha 
investigado con una variedad de sustancias y de especies. Ho, Richards y Chute 
(1978) reseñan gran parte de este trabajo. 

En lo que respecta a la evidencia de Overton, la explicación que viene de inme- 
diato a la mente es similar a la hipótesis del control de estímulo de Schneider. Se- 
gún esta perspectiva, los estados drogados y no drogados se distinguen en térmi- 
nos de diferencias en: a) cómo se perciben los estímulos externos (por ejemplo, la 
visión puede hacerse borrosa en el estado drogado); 0) la presencia o ausencia de 
estímulos interoceptivos distintivos, como sucede con los '“sentimientos”” dife- 
rentes que experimentamos cuando nos sentimos somnolientos o en estado de 
alerta, cuando tenemos sed, etcétera. Si estos tipos de estímulos fueran radical- 
mente distintos en los estados drogado y no drogado, podría explicarse la falta de 
transferencia, La presencia y ausencia de pentobarbital (y de sus efectos internos) 
Llegan a constituir estímulos discriminativos ante los cuales se emiten respuestas 
diferentes. 

Overton previó esta interpretación del '*estímulo*” y estableció varias condi- 
ciones de control para determinar lo admisible de la misma, El aprendizaje de 
discriminación de hábitos conflictivos en presencia y en ausencia de pentobarbital 
se comparó con el que se obtuvo en presencia y en ausencia de los siguientes 
estímulos: la droga flaxedil (un relajante muscular periférico), el hambre y la sed, 
una luz ambiental en el laberinto, una luz, un tono y una descarga fuerte. Sólo en la 
última condición se produjo un aprendizaje de discriminación (**disociación””) signi- 
ficativa, y la tasa fue notablemente más lenta que con el pentobarbital. 

Ante tales pruebas podemos reaccionar de dos maneras. La primera consiste en 
atenerse a la interpretación del estímulo y exclamar, maravillados, qué estímulo 
tan poderoso y efectivo es la inyección de pentobarbital. La segunda es considerar 
que la interpretación del estímulo se hizo ad hoc y que, por lo tanto, es vana: debe- 
mos rechazarla y buscar otras explicaciones. Una alternativa que propuso Overton 
es que al modificar los umbrales y los patrones de disparo de las neuronas, la dro- 
ga puede hacer que se activen diferentes circuitos nerviosos que los que se acti- 
van en el estado no drogado. En este caso, las diferencias consistirían en diversos 
patrones o en distintos tiempos de descarga de las neuronas, de modo que se usan 
los circuitos o las rutas diferentes de una red nerviosa compleja. Esta hipótesis es 
especulativa y sólo cuenta en su favor con los resultados originales, 

Chute y Wright (1973; también Wright y Chute, 1973) señalan que el estado in- 
terno importante (drogado o no drogado) es el que está disponible durante la 
consolidación de la memoria, en vez de antes de la experiencia de aprendizaje per 
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se, y durante su transcurso. Estos investigadores administraron pentobarbital só- 
dico a la mitad de sus ratas experimentales inmediatamente después de la expe- 
riencia en una tarea de evitación pasiva de un ensayo. Más tarde, se sometió a 
prueba a la mitad de estas ratas en estado drogado, y a la otra mitad en estado no 
drogado. Sorprendentemente, los animales mostraban mejor memoria (es decir, 
evitaban de manera consistente) cuando su estado de prueba concordaba con su 
estado justo después del ensaya de aprendizaje. Tales resultados apoyan la hipó- 
tesis de dependencia de estado, según la cual la recuperación de una memoria se 
produce con más seguridad si el estado de recuperación se equipara al que domi- 
naba cuando se consolidaba la experiencia de aprendizaje. Desafortunadamente, 
este resultado específico no se ha repetido de modo confiable. 

Se han hecho varios intentos de producir, mediante diferentes drogas, aprendi- 
zaje dependiente de estado en los seres humanos (Swanson y Kinsbourne, 1979). 
Los resultados no han sido totalmente satisfactorios, tal vez debido a las va- 
riaciones usadas en las mediciones de la memoria, Un importante discernimiento 
proviene de Eich y sus asociados (1975), quienes concluyeron que los efectos de 
recuperación dependientes de estado tenían más probabilidades de encontrarse 
cuando se le plantean altas exigencias al sujeto para que genere sus propios indi- 
cios de recuperación. Así, si se les pide que recuerden libremente una lista de pa- 
labras aprendidas varios días antes, la instrucción de “recordar esa lista de 
palabras”, es relativamente no específica, y exige que el sujeto genere sus pro- 
pios indicios (por ejemplo, “¿qué clase de palabras eran?””). Este tipo de ejecución 
de memoria tiene más probabilidades de ser afectada cuando el estado drogado de 
la persona se cambia entre el aprendizaje y la prueba de retención. Por otra parte, 
si la memoria se comprueba mediante el método de reconocimiento (por ejemplo, 
** ¿cuál de estas palabras se encontraba en la lista: curchara o cielo?””), o al propor- 
cionarle fuertes indicios asociativos o semánticos (por ejemplo, *'Un utensilio de 
cocina'”), el sujeto no tiene que buscar sus propios indicios de recuperación. En 
este caso, los efectos dependientes de estado son mínimos; es decir, la ejecución 
de memoria no se ve muy afectada por la congruencia del estado de recuperación 
con el estado de aprendizaje. 

Un experimento de G. H. Bower, Monteiro y Gilligan (1978) indica que el esta- 
do de ánimo del aprendiz puede servir como un ““estado'”* o contexto capaz de 
producir un efecto dependiente de estado. Por medio de la hipnosis, Bower y sus 
asociados indujeron a sus sujetos a sentirse felices mientras aprendían una lista de 
palabras, y tristes cuando aprendían otra; más tarde, intentaban recordar libre- 
mente cada lista mientras estaban felices o tristes. Las puntuaciones de retención 
promediaron 78% para la lista aprendida en el mismo estado de ánimo que el del 
recuerdo, pero sólo 47% para la lista aprendida en distinto estado de ánimo. Los 
investigadores llegaron a la conclusión de que el estado emocional actúa corno un 
contexto distintivo en el almacenamiento y la recuperación de las memorias. Su- 
gieren que el estado de ánimo se comporta como elemento cognoscitivo constante 
en la MCP que se estampa sobre las experiencias entrantes que se aprenden, y 
que también predispone la dirección de las búsquedas asociativas de objetivos 
específicos de la memoria. Esto podría explicar el aprendizaje y el recuerdo selec- 
tivo de las experiencias tristes o negativas de la vida en pacientes psiquiátricos 
deprimidos: las inclinaciones en la memoria operan en un círculo vicioso a fin de 
mantener la depresión. 
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Overton (1978) ha reseñado las principales teorías así como los problemas me- 
todológicos que implica probar una forma consistente de la hipótesis de aprendiza» 
je y recuperación dependientes de estado. Es difícil mostrar efectos consistentes 
dependientes de estado por encima de la operación de diversos “efectos centra- 
les”? simples. Un primer efecto simple es que el material aprendido mientras el su- 
jeto está drogado tal vez se aprenda mal, a menudo con lentitud, y se olvide con 
facilidad independientemente del estado en que se encuentre en el momento de la 
prueba. Esto es lo suficientemente comprensible si la droga bloquea tan sólo el al- 
macenamiento o consolidación del material en la MEP. Por ejemplo, dos o tres 
tragos cargados de alcohol retardarán de modo significativo el aprendizaje verbal 
y pictórico (Parker, Birnbaum y Noble, 1976). La intoxicación severa impedirá 
casi cualquier aprendizaje consolidado, aunque es posible que la persona que ha 
bebido atienda y reaccione conscientemente (con lentitud) a los eventos en su 
pa una droga a menudo tiene un efecto directo en la ejecución de 
la pruel 

En algunos casos este efecto es de facilitación, como“cuando el alcohol reduce el 
excesivo temor y permite la ejecución más eficiente de una respuesta activa de 
evitación (por ejemplo, elimina el “congelamiento”? inadaptado); en otros, el efec- 
to es ligeramente debilitante, como cuando el alcohol reduce la concentración, la 
motivación y la ejecución en una prueba de recuerdo. 

Deutsch y Roll (1973) han argumentado que estos efectos centrales simples 
bastan para explicar Jos resultados que se consideran como evidencia del aprendi- 
zaje dependiente de estado y/o el recuerdo bajo las drogas. En estos casos, donde 
hay una “interacción residual verdadera'” entre la presencia versus la ausencia de 
la droga durante el entrenamiento y la prueba, para interpretar los resultados 
puede emplearse Ja hipótesis del control del estímulo (Schneider, 1967). En otras 
palabras: se supondría que el recuerdo es mejor cuando los estímulos contex- 
fuales presentes durante el aprendizaje se reinstalan tan completamente como sea 
poe en el transcurso de la prueba de retención. Este es un principio muy anti- 

y apreciado en los estudios de la retención humana (véanse Pan, 1926; MeGeoch 
e Sita 1952). Se le utiliza, por ejemplo, para aislar material interpolado y evitar que 
cree interferencia en el recuerdo de algún material originalmente aprendido. En 
un ilustrativo estudio inicial, el aprendizaje interpolado que tenía lugar mientras el 
sujeto se encontraba en trance hipnótico, causaba poco olvido de una lista original 
que se aprendía y más tarde se recordaba en el estado normal de vigilia. La se- 
cuencia inversa de estados (aprendizaje original y segunda prueba realizados cuan- 
do el sujeto se encontraba en un trance con aprendizaje interpolado que se 
producía mientras era consciente) también reducía drásticamente la interferencia 
retroactiva. 

Estos y muchos otros estudios ilustran el fuerte influjo que la reinstalación del 
contexto original del aprendizaje ejerce sobre el recuerdo. 

En sintesis, las nociones de estados disociados y de aprendizaje dependiente de 
estado como preparaciones fisiológicas únicas, por lo general no han sido aceptadas 
ni apoyadas en las investigaciones recientes. Existen suficientes explicaciones 
acerca de los datos asequibles, de modo que la parsimonia pide que las hipótesis 
más “llamativas y audaces'” de la disociación bioquímica de los estados cerebrales 
permanezcan a la espera hasta que la nueva evidencia claramente exija una formu- 
lación similar a la de tales conjeturas. 


UDservaciones nales 


Al mirar en retrospectiva nuestro estudio, es evidente que en las últimas déca- 
das se han hecho grandes progresos en la neuropsicología. Sin lugar a dudas, en 
la actualidad es imposible realizar un análisis profundo y completo de temas como la 
conciencia, la disposición, la discriminación, el reconocimiento de patrón, aten- 
ción, excitación, impulso, recompensa, y muchos otros, sin otorgar un lugar pro- 
minente a las contribuciones de la experimentación neuropsicológica al conoci- 
miento de estas materias. Esta ha sido en verdad una gran realización, por la cual 
hay que elogiar a cientos de investigadores. Sin embargo, desde el punto de vista 
de esta obra, el problema más recalcitrante de la newropsicología ha sido nuestro 
tema central: el aprendizaje o almacenamiento de información en el sistema ner- 
vioso. Con algunas excepciones, hemos examinado las corrientes más importan- 
tes de las investigaciones neuropsicológicas acerca del aprendizaje. 

Cuando las cosas se contemplan en términos neurológicos, como hemos he- 
cho en este capítulo, el problema central sigue siendo encontrar las bases f- 
siológicas de la asociación. De suponer que entre diversas poblaciones de neuro- 
nas (estructuras) existen múltiples conexiones, se sabe que la actividad cercana 
en el tiempo de dos de ellas hace que se asocien de algún modo primitivo o básico, 
con el resultado de que ahora una es capaz de excitar a la otra, cuando antes no 
sucedía así. Se han mencionado varios enfoques que intentan explicar cómo se 
produce este fenómeno. La explicación más factible aún es una hipótesis, que 
plantea que de alguna manera hay un aumento en la ““eficiencia”* de circuitos ner- 
viosos particulares. Los estudios farmacológicos de Deutsch señalan otros de- 
talles de esta eficiencia acrecentada. 

Un problema conceptual de muchos modelos neuronales del condicionarniento 
es que adoptan la visión de sustitución del proceso, en la cual el EC viene a re- 
emplazar al E7 para producir la R7. Pero desde mediados de la década de 1930 esa 
opinión se ha descartado como explicación general. Incluso los mamiferos infe- 
riores aprenden acciones dirigidas a una meta, na respuestas especificas. Por 
ejemplo, se puede entrenar a una oveja para que levante la pata izquierda delante- 
ra de un piso enrejado al sonar un tono que señala una descarga eléctrica inminen- 
te. Si se lo obliga a tenderse sobre el lomo con la cabeza sobre el piso enrejado, y 
se oye el tono, el animal levantará cabeza y la parte superior del cuerpo, para 
alejarlos del lugar de la descarga. El animal hace lo que las circunstancias re- 
quieren para evitarla; no ba aprendido una respuesta estereotipada provocada por 
la descarga en su pata izquierda delantera. En las publicaciones acerca del condi- 
cionamiento abundan las demostraciones de este tipo. Tolman las condensa en su 
hipótesis de que los organismos aprenden acciones con dirección de meta, y no 
movimientos musculares. Evidentemente, lo que se necesita en estos casos es 
tina teoría que explique cómo se transfiere el aparato de habilidades motoras de un 
organismo a cualquier situación nueva, de modo que una acción tendiente a lograr 
una meta (como la de evitar la descarga en la rejilla) se ejecute de una manera sen- 
sible a las limitaciones de la situación. Hull intentó abordar este problema de la 
equivalencia de la respuesta al formular su teoría de una jerarquía de farnilia de há- 
bitos ligada por una meta anticipada. 

Sin embargo, muy pocas teorias neurológicas del aprendizaje han tratado con 
tales complejidades. Más bien se han centrado en modelos en los cuales el apren- 
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dizaje consiste en la alteración de la eficiencia de disparo de circuitos nerviosos 
especificos. 

Para que el lector no crea que el análisis del papel de las neuronas nos ha alejado 
demasiado de nuestro objeto de estudio, la conducta, es conveniente hacer notar 
que pueden diseñarse con facilidad redes apropiadas de *“neuronas modelo”, que 
muestran capacidades muy sorprendentes de discriminación y ejecución. Esta 
fnea general de pensamiento teórico, la de modelar las capacidades de ejecución al 
diseñar redes nerviosas, se inició con un primer artículo de Pitts y McCufloch 
(1947), y desde ese entonces ha seguido avanzando. Un libro de Culbertson 
(1962) incluye un estudio reciente de algunos de los resultados. En términos ge- 
nerales, dada cualquier función de transferencia que convierta diversas informa- 
ciones de entrada (estimulación) en informaciones de salida (respuesta), puede di- 
señarse una red nerviosa estática que produzca esa función de transferencia. Las 
hipotéticas neuronas de esas redes operan en su totalidad según los mismos pria- 
cipios simples, que en su mayor parte se han originado en las investigaciones 
neurofisiológicas. Además, si se dan por supuestas ciertas premisas relacionadas 
con la forma en que la retroalimentación del ambiente (a través del reforzamiento 
y el castigo) cambia la eficiencia de las vías nerviosas, entonces los modelos de 
redes nerviosas exhibirán aprendizaje adaptativo en diversas situaciones. Rosen- 
blatt (1953, 1962) muestra cómo una red nerviosa amplia, que comienza con inter- 
conexiones totalmente accidentales, produce (mediante reforzamiento) una ejecu- 
ción discriminativa ordenada. También nos proporciona una explicación de este 
enfoque general de la construcción de modelos de conducta. 

Por lo regular, las personas que construyen mecanismos automáticos de redes 
nerviosas no afirman que sus diseños representen exactamente la manera en que 
el sistema nervioso logra operar como lo hace en una ejecución característica. Bá- 
sicamente, se limitan a mostrar que tomando a las neuronas simples como ele- 
mentos pueden diseñarse redes que no contradicen las pruebas neurofisiológicas, 
con el fin de ilustrar algunas capacidades de los organismos. Como tales, los meca- 
nismos automáticos constituyen '*pruebas de suficiencia**, y esto significa que 
puede producirse conducta interesante a partir de constelaciones de elementos 
nerviosos simples de encendido y apagado. Aunque en algunas comunidades 
científicas se aprecian los productos de estos esfuerzos, en otras no sucede lo 
mismo. Desde el punto de vista de quienes trabajan en la neutofisialogía, las 
teorías de red nerviosa ignoran demasiado de lo que se conoce acerca de la neuro- 
na y la estructura del sistema nervioso. Sea como fuere si la neurofisiología formu- 
la una teoría explícita capaz de considerar los datos conductuales, ésta tendrá una 
forma algo distinta de la de los tipos de esquemas que actualmente diseñan 
quienes trabajan con los mecanismos automáticos de red nerviosa. 

El trabajo teórico más extenso e interesante acerca de los modelos de la red 
neural del aprendizaje es el de Stephen Grossberg (1974, 1975, 1978), Comienza 
con la formulación de propiedades elementales de las redes de neuronas, presupo- 
ne que los estímulos y respuestas específicas tienen circuitos neuronales corres- 
pondientes en el cerebro, y que el aprendizaje de los patrones de estímulo, 
secuencias, O patrones sensoriomotores se efectúa mediante equivalentes neuro- 
nales de jormación de asociación (por ejemplo, una condición sináptica acrecenta- 
da a lo largo del circuito **correcto””). Grossbery formula las interacciones y proce- 
sos del aprendizaje con ecuaciones matemáticas, y deriva ecuaciones del aprendizaje 


662 Tercera parte. Campos relacionados 


y de los mecanismos básicos. (La teoría es similar a la de Wickelgren, que hemos 
visto.) El investigador infere un gran número de interesantes teoremas acerca del 
condicionamiento clásico y el instrumental, la motivación y la ejecución; aprendiza- 
je serial, capacidad de memoria, aprendizaje configurativo, ejecución motora habi- 
lidosa, atención, detectores de característica, MCP, planes, y otros fenómenos. 
que intrigan a las teorías del aprendizaje. En cada caso, las derivaciones dependen 
de premisas realistas acerca de la red neural que ejecutará la tarea, y sobre la ma- 
nera en que el aprendizaje y los procesos de excitación/inhibición armonizar y uti- 
lizan esas estructuras de red. Aunque las conjeturas se hacen de la forma más 
consistente y razonable posible en relación con la neurofisiología (aunque Gross- 
berg es un matemático posee grandes conocimientos acerca de este campo), la 
teoría emplea básicamente un ''sistema nervioso conceptual”, y las unidades neu- 
rales de la teoría se tratan de un modo muy parecido, por ejemplo, alo que Estes 
haría con los hipotéticos elementos de estimulo, o como los teóricos de la memo- 
ria semántica considerarían a los nodos de concepto en una red de memoria aso- 
ciativa (véanse Anderson y Bower, 1973, y el capítulo 13). Esta unificación del 
vocabulario teórico de varios enfoques distintos es un criterio muy positiva, 

Las investigaciones acerca de la neurofisiología del aprendizaje siguen adelante 
aun ritmo acelerado. Á juzgar por el pasado reciente, es posible que su futuro sea 
pleno de asombrosos descubrimientos, de invención de técnicas novedosas y de 
profundos cambios en nuestras concepciones del sistema nervioso y su relación 
con la conducta. De hecho, pocas ramas de la psicología han ofrecido recientemen- 
te una tasa de producción de descubrimientos empíricos significativos tan alta 
coro la psicología fisiológica. Es más fácil encontrar perlas en un campo todavía 
no explorado que en otro que ya ha sido intensamente investigado, y durante 
muchos años. 


LECTURAS COMPLEMENTARIAS 


Se encuentran disponibles varios iibros de texto excelentes acerca de la psicología fisioló- 
Ha; cada uno de ellos cuntiene una revisión muy detallada de los resultados en el aprendizaje: 


Carlson, N. R., Physiology of behavior, 1977. 

Deutsch, J. A. y Deutsch, E., Pkystologica! psychology, 1973. 
Thompson, R. F., Foundations of physiological psychology, 1967. 
Thompson, R. F., Introduction to phystologica! psychology, 1975. 


Se recomiendan los siguientes libros acerca del cerebro y el comportamiento: 


Hebb, D. O., The organization of behavior, 1949. 

John, E. R., Mechanistas af memory, 1967. 

McGaugh, J. L. y Herz, M. J. (dirs.), Memory consolidation, 1972. 

O'Keete, J. O. y Nadel, L., The kippocempus as a cognitive map, 1978. 

Pabram, K., Lenguages of the brain, 1971. 

E M. R. y Bennett, E. L. (dirs.), Neural mechanisms of learning and motivacion. 
1976. 
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Aplicaciones a 
la 


educación 


Cualquier separación entre la ciencia básica y la aplicada resulta desafortunada. 
Con el transcurso de los años, los ayances científicos han surgido en íntima 
relación con los adelantos tecnológicos. Los creadores de instrumentos (mi- 
croscopios, telescopios, transistores, computadoras) abrieron nuevos cam- 
pos en la investigación básica; desde hace mucho tiempo, los inventos van a la par 
de los descubrimientos científicos. Para aplicar las lecciones históricas de la 
astronomía, la física, la biología (y sus tecnologías relacionadas) a la psicología del 
aprendizaje, cabría esperar una intimidad semejante entre la teoría y la investiga- 
ción en los procesos básicos del aprendizaje y los aspectos aplicados de la instrucción 
en las escuelas. Aunque muchos estudiosos del aprendizaje realmente se preocu- 
pan por la instrucción, esto no es una verdad universal. La desigual inclinación 
hacía las aplicaciones en parte se manifiesta en la división del trabajo y la especiali- 
zación del conocimiento: hay aspectos **puros'”” de la ciencia en el estudio del 
aprendizaje, igual que en otros campos de investigación, y el científico que profun- 
diza en los problemas fundamentales tal vez no se interese en aplicar lo que 
sabe. Así, no podemos esperar que cada genetista se sienta atraído por la cría de 
animales de granja, aunque lo que aprende sea útil, en última instancia, para el 
criador. Si bien los investigadores del aprendizaje se interesan por la ciencia pura, 
aparte de las aplicaciones, algunos se preocupan mucho por la tecnología de la ins- 
vucción. El alcance de esta inquietud se refleja en las revisiones dedicadas 
específicamente a la psicología de la instrucción (Gagné y Rohwer, 1969; Glaser y 
Resnick, 1972; Wittrock y Lumsdaine, 1977). Por nuestra parte, en este capítulo 
examinaremos algunos de los problemas que implica tender un puente sobre el 
abismo que existe entre el laboratorio y el salón de clases, con la convicción de 
que una teoría del aprendizaje sólida debe convalidarse mediante la influencia que 
ejerza en la práctica. 

Moverse de la tenría a la práctica no resulta nada fácil. La visión ingenua es que 
el investigador posee un cierto tipo de botiquín que le ayuda a resolver los proble- 
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mas del maestro. Cuando aparece un contratiempo, el maestro puede tomar un 
principio psicológico del botiguín y aplicarlo como una venda o un ungúento para 
resolver el problema educativo. Cada vez reconocemos más que para movernos 
firmemente de la investigación básica a la práctica necesitamos un análisis detalla- 
do de la tarea educativa, de las habilidades componentes que se enseñarán, y de 
los recursos de aprendizaje del niño y del sistema escolar. Debemos tener en 
cuenta el programa de estudio real de la escuela y los contextos sociales en los 
que se produce el aprendizaje. 


IDEAS DE LA TEORÍA DEL APRENDIZAJE ÚTILES 
EN LA EDUCACIÓN 


Aunque ño apoyamos la concepción ““de botiquín”, la aplicación directa del co- 
nocimiento desde el laboratorio hasta el salón de clases no ha de rechazarse por 
completo. Muy a menudo el conocimiento de laboratorio nos ayuda a comprender 
cuáles son algunas de las variables y de las influencias importantes, incluso antes 
de que éstas se hayan formulado de una manera más prescriptiva. Al señalar dónde 
buscar y qué esperar, tales principios permiten efectuar un mejor análisis. Los es- 
tudiosos del aprendizaje que no se han dedicado en profundidad a los problemas de 
la instrucción pueden, sin embargo, ofrecer algunos consejos útiles, parte de los 
cuales proviene de quienes se orientan hacia las teorías E-R, de aquellos que 
muestran mayor inclinación hacia las teorías cognoscitivistas y de los que se inte- 
resan por la motivación y la personalidad. 


1. Objetivos condurinales 

Para el conductista, Jas metas de cualquier programa educativo deben estipular- 
se en términos conductuales concretos, preferentemente en comportamientos 
que puedan medirse. Sólo entonces el maestro sabrá cómo diseñar un programa 
que moldee la conducta del estudiante hacia esas metas, y evaluar el grado en que 
se han eumplido. La especificación de las metas educativas en términos de objeti- 
vos conductuales es contraria a la tradición, que por lo común las establece en tér- 
minos de actitudes, habilidades anabticas, comprensión y apreciación del tema de 
estudio. Mager (1961) fue uno de los primeros en proponer la redacción de objeti- 
vos conductuales para la educación, y escribió una guía acerca de la forma de tra- 
ducir metas vagas en conductas mensurables (Mager, 1972). El propio proceso de 
traducción tiene un efecto benéfico tanto en el maestro como en el estudiante, al 
obligar al primero a reflexionar con exactitud acerca de lo que cree que es más im- 
portante que el estudiante sepa, y qué conductas de éste constituyen una evidencia 
de su conocmiento en la materia. La redacción de objetivos conductuales se ha con- 
vertido en una práciica común y sumamente difundida en muchos sistemas escola- 
res, debido al creciente interés del público por extender el sistema de ense- 
nanza. 

Por ejemplo, a los padres de un niño que estudia lectura en quinto grado es posible 
presentarles en detalle las competencias específicas de lectura que se espera que 
el niño demuestre al término del curso. Con frecuencia, las academias de instruc- 
ción en lectura o matemáticas anuncian sus programas en términos específicos de 
objetivos conductuales de avance pera el aprendiz. Estos cambios en el estableci- 
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miento de las metas educativas han sido en gran parte provocados por el influjo 
que los conductistas ejercieron en la enseñanza. 


2. Análisis de tarea o de habilidades : 

En la tendencia a estipular metas educativas en términos conductuales está 
implícito el requisito de que el educador analice la tarea criterio (por ejemplo, mul- 
tiplicar dos números de tres dígitos) en sus componentes conductuales elementa- 
les y observe la manera en que ellos se organizan. Esto conduce, a su vez, a la 
evaluación del repertorio inicial del niño y al diseño de un programa educativo que 
enseñe los diversos componentes de la habilidad criterio. Para multiplicar dos nú- 
meros de tres dígitos, al niño se le debe enseñar —entre otras cosas— a escribir 
los números en columnas, a multiplicar la parte inferior de derecha a izquierda, a 
llevar los dígitos de diez de una multiplicación y agregarlos a la siguiente columna, 
acambiar el punto de partida de la segunda y tercera líneas de la multiplicación por 
un lugar, etcétera. Estos microanálsis revelan la complejidad de las habilidades 
que comúnmente se enseñan en la escuela. La obra de Gagné (1970 y Gagné y 
Briggs, 1974) ha sido muy útil para descomponer varias habilidades educativas en 
una jerarquía de subhabilidades, al observar cómo depende una de otra. Más ade- 
lante examinaremos este trabajo, cuya idea central se ha aplicado en la investiga- 
ción educativa (véase Calfee y Drum, 1978, para un análisis de tarea de las habili- 
dades elementales de lectura). 


3. Moldeamiento 

El análisis de una meta educativa en una jerarquía o serie de componentes con- 
ductuales implica un programa educativo. En particular, las habilidades fundamer- 
tales se enseñan primero porque, según el análisis de tarea, otras partes de la 
competencia criterio dependen de éstas. Así, la multiplicación de dos dígitos no se 
enseña sino hasta que el niño ya puede efectuar multiplicaciones de un dígito y su- 
mar; la suma no se enseña sino hasta que se identifiquen y usen los números mis- 
mos, discriminativamente. Por lo tanto, un análisis de tarea Criterio establece el 
orden en el cual deben enseñarse y dominarse las habilidades componentes. Esta 
progresión del adiestramiento desde lo simple a lo complejo, desde una unidad 
conductual simple hasta una secuencia de unidades, es muy parecida al procedi- 
miento de moldeamiento de Skinner, en el cual se enseña a los animales habilida- 
des complejas. Una diferencia reside en que el moldeamiento de animales el entre- 
nador debe esperar que ocurra una aproximación de la respuesta deseada antes de 
que pueda reforzarla, mientras que para los niños el profesor (o el texto) general- 
mente instruye al describir la respuesta correcta o al demostrarla mediante algu- 
nos ejemplos. Por supuesto, si los niños tienen grandes deficiencias lingúísticas o 
fracasan mvariablemente en prestarle atención al profesor, éste debe emplear mé- 
todos de condicionamiento aperante (acerca de la enseñanza del lenguaje a niños 
psicóticos no verbales, véase Lovaas, 1976). 


4. Respuesta activa A . 
Los conductistas creen que las personas aprenden mejor al manejar activamen- 


te el material de aprendizaje, responder a él, y relacionar una parte con otra. 
Guthrie, Thorndike y Skinner han puesto el énfasis en la respuesta activa. Las 
personas tienen más probabilidades de aprender del texto si se les formulan pre- 
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guntas acerca de él, si buscan las respuestas en el propio texto y las repiten act- 
vamente para sí mismos. En varios experimentos verbales (Bobrow y Bower, 
1969, Slamecka y Graf, 1978) se ha demostrado que los adultos recuerdan mejor 
Ja información que han tenido que conectar activamente de alguna manera prescri- 
ta. Por ejemplo, en los experimentos de Bower y Masling (1979) los adultos 
mostraron una mejor memoria para un conjunto de enunciaciones correlacionadas 
- o leyes empíricas falsas (por ejemplo, “la tasa de la esquizofrenia se incrementa 
con el tamaño de la familia”*) si se los obligaba a inventar una explicación causal de 
cada una en el término de unos cuantos segundos. Generar una explicación perso 
nal resultaba mucho más benéfico que leer una explicación realizada por otra per- 
sona. Además, todos los cursos de mejoramiento de lectura destacan la importan- 
cia de que Jos lectores esbocen mentalmente el contenido de lo que leen, y lo 
escriban enseguida de examinar superficialmente el material. El esbozo ha de 
completarse o corregirse a medida que los estudiantes lean otra vez el materíal, a 
un ritmo más lento. 

Otro ejemplo de respuesta activa se da en el aprendizaje de las matemáticas, 
Aparentemente éstas se enseñan y se aprenden, en gran parte, al trabajar con mu- 
les de problemas, los cuales ejemplifican ciertos conceptos matemáticos, opera- 
ciones o reglas. En el aprendizaje de las matemáticas practicamos realizando 
muchos de estos ejercicios hasta llegar a un nivel donde algún tiempo después po- 
demos desempeñamos correctamente, pero sin ser capaces de establecer las 
reglas generales de las matemáticas que justifican nuestra ejecución (por ejemplo, 
los pasos algebraicos detallados para resolver dos ecuaciones iineales con dos in- 
cógritas). Las reglas se han traducido en hábitos automáticos, o '“producciones””, 
que en gran medida se llevan a cabo sin la verbalización o el esfuerzo consciente 
(véase el examen de las producciones en el capítulo 12). 


5, Recitación y práctica 

En la mayor parte de las habilidades académicas básicas como la lectura, la 
esentura y la aritmética no existe ningún sustituto para la práctica reiterada. Sólo 
mediante la práctica estos hábitos se volverán automáticos y se ejecutarán con ra- 
pidez y sin esfuerzo. Como los hábitos basados en las reglas deben ser generales 
(por ejemplo, multiplicar cualquier número de tres dígitos), obviamente debemos 
practicar con una variedad de ejemplos específicos de la regia. Esta ejercitación 
también es muy benéfica si cada respuesta va seguida de retroalimentación que in- 
dique si es correcta o equivocada y, si lo es, dónde reside el error. 

Muchos estudios en el aprendizaje verbal han demostrado que el hecho de que 
el sujeto practique la recitación del material que ha de aprender constituye una 
influencia positiva sobre la memoria posterior. En un experimento clásico de Ga- 
tes (1971) se demostró que después del tiempo mínimo necesario dedicado a la 
lectura pasiva del material que había de aprenderse (biografías y sílabas sin sentido 
en diferentes experimentos), los estudiantes aprendieron más no al leer una y otra 
vez, sino al tratar de recitar activamente el material de memoria, instigándose o 
recordándose a sí mismos mediante el texto a fin de cubrir los detalles olvidados. 
Los resultados se han sostenido bastante bien con otros materiales durante los 
años siguientes. El vaior de la recitación activa es en parte motivacional, ya que el 
sujeto establece metas personales de recuerdo y verifica su progreso; el valor es 
también parcialmente informativo, ya que los fracasos en una recitación destacan 
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el material específico en el que los esfuerzos de aprendizaje y retención deberán 
concentrarse en el siguiente ciclo. Además, parece que el recuerdo posterior es en 
gran medida una cuestión de recuperar el plan actual para la recitación. 

La recitación activa es una prescripción común en todas las guías acerca de las 
habilidades de estudio, y es claramente benéfica. Después de leer una sección del 
texto, al estudiante se le pide que bosqueje los puntos principales y que recite ese 
esbozo y su contenido de memoria, en varios momentos. 


6. Guías de estudio prescritas 

Estas prescripciones de repetición en voz alta y revisión son las últimas dos R 
del famoso programa EPL2ZR para el mejoramiento de las habilidades de estudio 
(Robinson, 1961) que se enseñan en muchas escuelas. Las partes de la fórmula se 
refieren a los aspectos importantes de la lectura y la asimilación del material tex- 
tual; por ejemplo, un capítulo de un libro de texto escolar. El primer componente 
consiste en examinar el contenido del capítulo leyendo los encabezados de sec- 
ción; el segundo, en plantearse a uno mismo de cinco a diez preguntas basadas en 
tales encabezados; el tercero consiste en Jeer el texto y buscar respuestas a las 
preguntas planteadas; el cuarto, en secitar en las propias palabras el contenido de 
lo que se leyó y tal vez escribirlo en forma de bosquejo. Finalmente, en el quinto 
se trata de revisar el esbozo y volver a leer el capítulo para refrescar sus puntos 
principales. 

El examen preliminar proporciona al estudiante una estructura para que organi- 
ce los numerosos puntos que debe leer. Este esbozo actúa como un organizador pre- 
vio (Ausubel, 1960) que ayuda al aprendiz a categorizar, encasillar e nterrela- 
cionar los temas específicos del capítulo. La razón fundamental que sustenta a los 
organizadores de avance proviene de la creencia inicial de los psicólogos Gestalt 
de que w: conjunto de información se aprende mejor al comprendes cómo se 
complementa, qué partes dependen de —o se apoyan en— otras, y cómo se orga- 
nizan. Por supuesto, los bocetos de capítulo y los de lectura cumplen exactamente 
este cometido. Las investigaciones posteriores acerca del aprendizaje a partir de 
un texto (por ejemplo, Meyer, 1975; Kintsch y van Dijk, 1979) se han interesado 
en la organización de los textos, en la manera en que el escritor comunica esta or- 
ganización al lector, y en la forma en que tal comunicación puede facilitarse. Parte 
de este material fue examinado en el capítulo 13. 

Un problema básico con esas guías prescritas de estudio es que a los estudian- 
tes les parecen un trabajo arduo (más que la lectura pasiva), y par eso tienden a no 
aceptarlas y a no continuar con ellas si no se integran algunos incentivos poderosos 
treforzadores). Pareciera que el deseo del estudiante de alcanzar una calificación 
alta es un reforzador demasiado remoto o débil, por lo tanto, muchos programas 
de mejoramiento del estudio requieren del autorreforzariento contingente del 
logro de metas de estudio cotidianas. 


7. Conducias reforzantes pertinentes u ja tares 

El reforzamiento de las conductas de estudio es un ejemplo del problema más 
general de moldear las conductas de importancia educativa. La cuestión surge al 
adiestrar a los estudiantes no sólo en hábitos de estudio autodirigidos, sino tam- 
bién en el comportamiento apropiado en el salón de clases. En la escuela primaria 
esto por lo común significa que el alumno debe llegar a tiempo, sentarse y perma- 


668 Tercera parte. Campos relacionados 


necer en silencio, atender a las explicaciones del maestro y seguir sus instruc- 
ciones acerca de cualquier tarea de aprendizaje. Estas conductas elementales son 
necesarias para fomentar un ambiente libre de desorden y distracción, en el cual la 
instrucción y el aprendizaje tengan oportunidad de hacerse efectivos. En una sec- 
ción posterior discutiremos algunas técnicas de modificación de la conducta que se 
emplean en el salón de clases. 

Para volver a las actividades de aprendizaje, los psicólogos se han dedicado a in- 
vestigar muchos problemas académicos que son resultado de la falta de atención, 
de la deficiente concentración y de defectuosos hábitos de estudio. Si un niño 
descubre que no puede concentrarse en la lectura, es posible alterar el ambiente 
a fin de reducir al mínimo la distracción; el material de lectura también puede mo- 
dificarse para provocar y mantener un elevado nivel de concentración. Guthrie di 
señó un método en el cual el estudiante se sienta en silencio y abandona su pupitre 
tan pronto como observa que su mente se distrae de la tarea. Mediante esta técni- 
ca, el pupitre y los libros se asocian exclusivamente con el estudio, no con pensa- 
mientos y fantasías que compiten con él. Un método más efectiva consiste en 
pedirle al niño que conteste una pregunta después de una o dos oraciones de la 
lección, y recompensar de inmediato sus respuestas correctas. En el transcurso 
de los ensayos se incrementa el mímero de oraciones leídas antes del examen, y 
las preguntas de éste piden la integración de información a partir de diversas ins- 
trucciones. Este método puede complementarse con la autoinstrucción (Meichen- 
baum y Asarnow, 1979), donde se enseña al niño a recitar en silencio (y seguir) 
un monólogo de orientación antes de la lectura y mientras ésta se desarrolla. El 
monólogo recalca la formulación de preguntas acerca del contenido del párrafo, 
para hacer un boceto a medida que se lee, relacionar una idea con otra o con algo 
más que se conozca, etcétera. Estos métodos simples resultan muy efectivos al 
tratar con niños que han tenido graves deficiencias en la concentración y en la 
comprensión de lectura. 

Las habilidades adultas de estudio también se han mejorado mediante los proce- 
dimientos de reforzamiento (Wark, 1976; Watson y Tharp, 1977). Son típicos los 
problemas de los estudiantes del bachillerato superior y de la universidad que no 
han formado hábitos de estudio apropiados. En el programa usual se le pide al es- 
tudiante que observe y registre su conducta de estudio durante una semana. En- 
tonces se inicia un procedimiento de adiestramiento de reforzamiento en el cual el 
alumno estudia sólo en uno o dos lugares donde no hay distracción, y se refuerza a 
sí mismo con algún privilegio deseado (por ejemplo, ver televisión) únicamente si 
cumple con ciertas metas de estudio mínimas (por lo general, el tiempo invertido, 
hs páginas leídas o los problemas solucionados) durante un día. Á menudo el estu- 
diante redacta su propio *“contrato””, especificando las metas que debe lograr para 
recompensarse a sí mismo. Á medida que el programa continúa, aumenta la canti- 
dad de trabajo requerida para el reforzamiento, y los reforzadores se tornan más 
simbólicos (por ejemplo, puntos ganados para asistir al cine durante el fin de sema- 
na). El estudiante es su propio “observador y reforzador””, y normalmente efec- 
táa una gráfica de su tiempo de estudio en cada curso académico. La gráfica de los 
logros autoinducidos (por ejemplo, las páginas que un autor escribe al día) con fre- 
cuencia es más reforzante que cualquier otra recompensa tangible. Junto con es- 
tas técnicas de reforzamiento para incrementar el tiempo de estudio, el maestro 
también instruye al estudiante en métodos de estudio efectivos como el EPL2R 
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que hemos mencionado, y técnicas para tomar notas (en lecturas u cunferencias) y 
revisartas a fin de promover el aprendizaje. 

Estas técnicas de reforzamiento son efectivas para superar el retraso, que 
equivale a la ruina de cualquier estudiante (y de cualquier profesional). La idea bá- 
sica consiste en subdividir un trabajo en muchos pequeños pasos a submetas, es- 
tablecerse una sola submeta en cierto momento, 0 recompensarse con un privile- 
glo acostumbrado (por ejemplo, un café por la mañana, un cojín por la noche, la 
lectura del periódico) sólo si se alcanza la submeta diaria. También es útil obtener 
el apoyo de un grupo o de nuestros amigos para el programa fijado, debido al re- 
forzamiento y a la motivación social que implica. 


8. Ansiedad en la prueba 

Aunque los educadores raras veces piensan en la ansiedad que genera la 
prueba, los estudiantes saben que ésta es un verdadero problema. Algunos se 
dejan llevar por el pánico durante los exámenes cruciales: se acelera su ritmo car- 
diaco, les tiemblan las manos y sus mentes quedan en blanco; interpretan las pre- 
guntas del examen de modo completamente erróneo, dan respuestas que más tarde 
reconocen como equivocadas, y desperdician el tiempo pensando en las conse- 
cuencias de su conducta. 

Los psicólogos consideran que la ansiedad que acompaña a los exámenes es sólo 
un ejemplo del temor aprendido, y al igual que otros, puede reducirse cunside- 
rablemente con el tratamiento correcta. Una técnica que ha demostrado ser exito- 
sa es la de sensibilización sistemática (véase el capítulo 3). 

Un procedimiento desarrollado por Wolpe (1958) sigue la idea del contracondiciu- 
namiento de Guthrie, y la desensibilización intenta sustituir la tensión y el temor 
que el estudiante experimenta en la situación de la prueba, por la respuesta de 
relajamiento. Se le enseña primero el relajamiento muscular profundo, y en su 
imaginación parea ese relajamiento con escenas visuales que gradualmente se 
aproximan a las situaciones de prueba que evocan la mayor ansiedad. Con la prác- 
tica repetida y la visualización, el estudiante extingue sus temores, y este estado 
conductual ha de transferirse a la situación de la vida real. Cuando sea posible, el 
procedimiento de relajamiento debe complementarse haciendo que el estudiante 
se relaje en la misma habitación en la que se aplicará el examen, que realice uno 
ficticio, etcétera. Se instruye al estudiante para que se relaje conscientemente 
mientras hace el examen, y para que se repita a sí mismo instrucciones de ajuste: 
'relájate, esto no es tan terrible. Concéntrate en el problema. Manténte tran- 
quilo. Piensa en otras posibles enfoques de resolución del problema. Respira pro- 
fundamente. Deja que tu euello, tu mandíbula y tus hombros se relajen. Trabaja 
con constancia, y pronto lo terminarás”' (Meichenbaum, 1977). Al estudiante tam- 
bién se le pueden enseñar habilidades específicas para realizar sus exámenes: de 
qué manera acertar en las preguntas de opción múltiple, cómo formarse una visión 
general acerca de un examen y de ese modo organizar el tiempo, de qué manera 
perfilar la respuesta para una pregunta de ensayo antes de comenzar a escribirla, 
etcétera. 

Usando estas técnicas con estudiantes que tenían fobia a los exámenes, los psicó- 
logos los han capacitado para reducir considerablemente su ansiedad durante la 
realización de la prueba a fin de mejorar su ejecución y sus calificaciones (Oster- 
house, 1976). 


670 


9. Metas e intereses 

Los psicólogos siempre han destacado que la mejor forma de fomentar el apren- 
dizaje consiste en capturar el interés del aprendiz por el tema de estudio. Interés 
es un término que cubre de modo no analítico muchos factores. pero por lo común 
se refiere a la naturaleza reforzante del material mismo (como las recompensas de 
libros de historietas para los niños), o a la percepción que tiene el niño de que el 
aprendizaje de tal material posee un claro valor instrumental para obtener alguna 
meta reconocible que no sea la calificación en un curso. Este vínculo entre los ob- 
jetivos del aprendizaje y las metas de la vida es lo que se conoce como '*pertinen- 
cia'* en los temas académicos. En muchos libros de texto y manuales de estudio 
se destaca explícitamente la relación entre el tema de estudio y los problemas 
prácticos de la vida cotidiana. Las prácticas de campo también incrementan la per- 
tinencia del aprendizaje en el salón de clases. En algunos cursos universitarios de 
psicología y educación se hace que los estudiantes apliquen activamente lo que 
aprenden al trabajar de forma directa con pacientes psiquiátricos, niños retrasados 
o emocionalmente desequilibrados, drogadictos y otros sujetos. Estas experien- 
cias de aprendizaje, que son valiosas no sólo para los estudiantes sino también 
para los receptores, a menudo incrementan de modo significativo la motivación de 
los estudiantes para aprender y a aplicar los conocimientos adquiridos en el salón 
de clases. 

En otro nivel, educadores y psicólogos han descubierto que es muy útil conce- 
der mayor libertad a los estudiantes para que establezcan sus propias metas, 
aprendan a su propio ritmo y evalúen su progreso (Goodwin y Caates, 1976). Sin 
embargo, los estudiantes pueden establecer sus propias metas sólo después de 
haber sido adiestrados para trabajar de modo responsable y efectivo, y para fijarse 
objetivos que correspondan a los del sistema escolar; por ejemplo, leer con un 
cierto nivel de corrección o superarlo. Pero dentro de esta estructura, los apren- 
dices autodirigidos tienen probabilidades de ser más felices y mejores alumnos, vi- 
gilan su tasa de trabajo, establecen submetas de acuerdo con lo que pueden exigirse 
en una perspectiva realista, y escogen programas de reforzamiento o recompen- 
sas de apoyo que les son muy satisfactorias, Estos procedimientos proporcionan 
motivación, hacen que aflore un sentimiento de éxito y aumentan la autoestima, 
la confianza y la competencia. Por supuesto, la mejor característica de los aprendi- 
Ces autodirigidos es que sólo tienen una mínima dependencia hacia el maestro, y 
están propensos a continuar aprendiendo cuando ya no se apfiquen los requisitos 
formales de la escuela. La desventaja es que los aprendices autodirigidos crean 
problemas con el horario de clases, el programa de estudios y las actividades del 
maestro. Se requiere de una nueva planeación y de un cambio en las rutinas tradi- 
cionales para que el aprendizaje autodirigido sea operante. 


10. Estructuración pereeptual de las tareas 

Una prescripción usual de los psicólogos Gestalt para el diseño de los materiales 
de instrucción consiste en hacer que la muestra perceptual destaque las caracte- 
rísticas esenciales del problema. Los dispositivos visuales, como las películas, 
las fotografías y los diagramas, presentan información estructurada en el espacio 
de cierta manera que se asemeja a su organización conceptual. Por ejemplo, 
la información en un párrafo de un texto que describe qué personas pertenecen 
a qué grupos, y qué grupos corresponden a qué organizaciones, puede descri- 
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birse como un diagrama de árbol o una red con nodos que representan grupos, y 
Sechas entre los nodos que simbolizan la relación de pertenencia a esos grupos. El 
dispositivo visual materialmente mejora la memoria para el párrafo mismo. De 
modo similar, a) presentar a los estudiantes problemas de física, un texto útil ofre- 
cerá el diagrama de un modelo o situación física correspondiente en el cual se re- 
calcan los factores más importantes. Quienes elaboran textos y programas de es- 
tudio conocen bien estas prescripciones acerca del énfasis perceptual, aunque no 
siempre las respetan. 

Para enseñar a los niños conceptos complejos, una estrategia útil (recomendada 
por los teóricos del aprendizaje) consiste en mostrar muchos casos negativos cer- 
canos y contrastantes ("yerros por poco””) junto a una variedad de casos positi- 
vos. En la figura 15.1 se presentan grupos de casos positivos y negativos para 
enseñar a los niños el concepto de la letra 4 mayúscula escríta a mano. El ver las va- 
raciones manuscritas dentro de los casos positivos permite al niño aislar 
características criticas y su rango admisible de variación. El conjunto de casos ne- 
gativos de yerros aproximados también le ayuda a aprender qué características 
debe tener o no una Á (como una barra horizonta! cerca de la mitad de las líneas 
inclinadas, o una línea horizontal extra o una vertical dentro de las mismas). Cada 
yerro resalta una característica o relación contrastante ligeramente distinta entre 
las partes, necesaria para un patrón A, y permite al niño desarrollar una regla 
complicada para la discriminación. Estas prescripciones —utilizar los yerros para 
enseñar conceptos difíciles (por ejemplo, distinguir turista de inmigrante) — nos 
parecen de buen sentido común y de una naturaleza arraigada en los maestros, 
pero en realidad fueron sugeridas por la investigación de laboratorio acerca del 
aprendizaje de discriminación. 


11. Enseñanza para la comprensión 

La investigación de laboratorio, iniciada por psicólogos Gestalt como Katona 
(1940), ha demostrado que el material aprendido mediante la comprensión de las 
razones (o las reglas) que sustentan algún fenómeno se retiene mejor y se trans- 
fiere con más facilidad que el mismo materia) aprendido por memorización de 
rutina. 

Por ejemplo, en las matemáticas un estudiante estará en mejores condiciones 
(para pruebas posteriores) al aprender el mecanismo que sustenta la generación 
de la distribución binaria, que si sólo memoniza la fórmula final para la distribución. 
De modo similar, debe aprender el sentido de una derivación matemática —como 
ka diferenciación de las funciones trigonométricas en vez de aprender tan sólo 
la fórmula, ya que el recuerdo posterior del sentido le permitirá volver a derivar la 
fórmula mucho tiempo después de que la haya olvidado con la memoria rutinaria, 
Las razones del rápido olvido de las fórmulas estadísticas sin sentido son obvias. Las 
que se recuerden son similares 0 interfieren unas con otras, y no hay una regla 
que nos ayude a clasificarlas, mientras que los conceptos que sustentan a las fórmu- 
las son significativos, bien diferenciados, e interconectados en un sistema lógico 
de reglas. 

Por lo general, los maestros advierten que es preferible el aprendizaje por 
comprensión (cuando resulta factible) e intentan enseñar a sus alumnos a com- 
prender conceptos, las interrelaciones de los mismos, y la base para las opera- 
ciones y reglas. Desafortunadamente, si los estudiantes no logran comprender en 


ARA 
ÓN 
IALATA 


Negativo (no A) 


SN 
PSSS 
ASA 
AE 


Figura 15.7. Colección de ejemplos positivos y negativos de yerros por poco de letras 
A mayúsculas. 


el nivel conceptuai, a menudo se dejan llevar por el pánico y recurren a la memori- 
zación repetida de las fórmulas. 


12. Dispositivos mnemónicos 

Con el paso de los siglos, tanto las personas con dotes teatrales como los 
maestros han desarrollado una batería de auxiliares de la memoria o dispositivos 
mnemónicos para ayudarse a sí mismos o a sus estudiantes a aprender material de 
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importancia. Un dispositivo mnemónico es un método para elaborar algún material 
que habrá de aprenderse, hacerlo más significativo, relacionarlo con cosas conoci- 
das y guiar el propio recuerdo con el objetivo de mejorar el aprendizaje y el mismo 
recuerdo. En el capítulo 13 hemos examinado estos dispositivos. 

La mnemotecnia intenta resolver problemas prácticos de la memoria. Los méto- 
dos, que varían con el material por aprender y la forma en que la memoria se someta 
a prueba, se explican en muchos de los libros más populares para el mejoramiento 
de la memoria (Furst, 1958; Lorayne y Lucas, 1974). Las pruebas del laboratorio 
demuestran que los métodos suelen ser sumamente efectivos. A continuación ve- 
remos algunos de ellos. 

Una técnica para aprender números (por ejemplo, números telefónicos) consis- 
te en dividirlos en grupos pequeños de 3 o 4 dígitos, convertir a cada uno de ellos 
en un sonido consonante estereotipado (por ejemplo, todos los números 2 son MN, 
todos los 4 son R, etc.), y agregar vocalés para formar una palabra significativa 
con cada grupo. Las palabras codificadas se recuerdan entonces en asociación con 
la persona que tiene ese número telefónico. Esas palabras vuelven a convertirse 
en el número cuando se lo necesita. 

Una técnica para aprender un conjunto o una serie de reactivos es el método de 
la palabra pretexto. Los ejemplos serían una lista del mercado, la serie de puntos 
en un discurso que debemos pronunciar o escuchar, las leyes de la percepción vi- 
sual, etcétera. Se memoriza primero una lista de diez o más palabras pretexto 
usando algún sistema, como las rimas: 'Bruno 2-hoz, 3-res, 4-teatro...'* Éstas se 
emplean como “ganchos'” mentales de los cuales se “cuelgan” las imágenes que 
representan a los reactivos que se desea recordar. El truco consiste en asociar 
una imagen de la primera palabra pretexto con una imagen concreta del primer re- 
activo, la segunda palabra con el segundo reactivo, y así sucesivamente. En la fi- 
gura 15.2 se ilustran los primeros cuatro “ganchos” y las imágenes interactivas 
para los cuatro primeros reactivos de una lista, La escena interactiva para cada re- 
activo ha de imaginarse alrededor de cinco segundos, a medida que se presenta la 
lista. Más tarde, cuando se desea recordarla, uno debe instigarse a sí mismo al re- 
citar la lista conocida de palabras pretexto, y preguntarse en cada una: '¿qué vi- 
sualicé con Bruno?, ¿la hoz?, ¿la res?...” 

Los experimentos demuestran que el método es muy efectivo, que a menudo 
incrementa el recuerdo al doble o al triple, y lo ordena correctamente (Bower, 
19704). Pueden colocarse muchas listas distintas con las mismas palabras pretex- 
to, con una ligera interferencia proactiva al recordar la lista más reciente. Un mé- 
todo comparable utiliza instantáneas mentales de ubicaciones alo largo de una ruta 
conocida (por ejemplo, el camino que se recorre para llegar a la escuela) en lugar 
de las imágenes de palabras pretexto; el empleo de las instantáneas mentales para 
memorizar otras listas es similar al de las palabras pretexto y produce beneficios 
equivalentes para el recuerdo. Ambos métodos dependen de las asociaciones ima- 
ginarias de reactivos y de un proceso que consiste en instigarse a sí mismo a in de 
revivir cada asociación. El método de la palabra pretexto se recomienda a los estu- 
diantes que deben recordar mucha información arbitraria, o una extensa lista de 
elementos en orden. Convertir materiales académicos en forma de palabras pre- 
texto (por ejemplo, traducir ideas abstractas a una imagen concreta que recuerde 
la idea), permite a los estudiantes usar el método y mejorar notablemente su me- 
moria y su ejecución en la prueba. Así, es muy aconsejable que los maestros pro- 


Número de Palabra Imagen Reactivo para Imagen de ' 


reactivo pretexto pretexto ser recordado conexión 
1 Bruno leche 
2 hoz pan 
iy _A 
" 

3 res ' j plátanos 

(4 

= 


vievo 


4 teatro 


171 
== 


¡AAA 


Imágenes de conexión: 


1. Leche derramándose sobre la cabeza de Bruno 

2. Una hoz que rompe un pedazo de pan francés 

3. Varias pencas de plátanos que cuelgan de los cuernos de una res 
4. La nieve que cae sobre el techo de un teatro 


Figura 95.2. Wustración del uso de una nemotecnia de palabra pretexto para recordar 
una lista, 
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porcionen dispositivos.mnemónicos para los temas de estudio que los alumnos de- 
ben recordar. 

Atkinson (1975; Raugh y Atkinson, 1975) ha proporcionado una demostración 
de gran significación educativa, de los dispositivos mnemónicos en la enseñanza de 
vocabularios de una lengua extranjera a estudiantes universitarios. Por ejemplo, la 
tarea de asociar una palabra española con su equivalente inglés se descompone en 
dos pasos: primero, pensar en una palabra clave inglesa con un sonido semejante a 
la totalidad o a una parte del vocablo español. Así, caballo suena como '“cob-eye- 
yo'*, de modo que eye sería una palabra clave apropiada; de manera similar, pato 
suena como “'pot-ho””, y por lo mismo pot sería una palabra también adecuada. La 
segunda etapa, que se describe en la figura 15.3, consiste en asociar la palabra cla- 
ve con la traducción inglesa de la palabra española al visualizar alguna escena de in- 


CABALLO —eye— HORSE 


Figura 15.3. Mé 
todo de palabra 
clave para el 
aprendizaje del 
vocabulario in- 
; Mi pez gles-español (to- 

mada de Atkin- 
PATO —pot— DUCK son, 1975) 
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teracción entre los dos objetos. Así, caballo significa “horse”; por lo tanto, pode- 
mos imaginarnos un caballo que patea un gran ojo, o un caballo con un ojo ciclópeo 
en la frente. Pato significa '*duck””, y se puede pensar en un pato con una olla que le 
cubre la cabeza, Estas imágenes tan extravagantes unen dos palabras distintas en 
la memoria, Aunque las dos fases se han descrito por separado, pueden enseñarse 
juntas, como se observa en la figura 15.3. Después de completar ambas fases, el 
aprendiz está en condiciones de pensar rápidamente de la palabra española a la palabra 
clave para la traducción. Éste es un ejemplo de aprendizaje mediano, que se examinó 
en el capítulo 6. 

Atkinson demostró que este procedimiento básico tenía una gran efectividad en 
comparación con un procedimiento de control en el cual los sujetos aprendían los 
reactivos del vocabulario sin ayuda de dispositivos mnemónicos. En un experi- 
mento, los sujetos entrenados con el método de ka palabra clave aprendieron un 
vocabulario ruso de 120 reactivos casi dos veces mejor que los sujetos de control, 
a los que se les daba un tiempo de estudio similar. La ventaja también se manifes- 
taba en una prueba al término de seis meses. El método de la palabra clave es- 
tablece asociaciones de doble sentido, de modo que un estudiante que ha aprendi- 
do a traducir del español a] inglés muestra una ligera ventaja sobre los sujetos de 
control cuando se le pide que traduzca del inglés al español, En otros experimen- 
tos, Raugh y Atkinson (1975) demostraron que la dificultad de aprender un par 
ruso-inglés con el método de la palabra clave podía descomponerse claramente en 
factores de dos partes: la probabilidad de recordar el vínculo entre el ruso y la pa- 
labra clave por la probabilidad de recordar el vínculo entre el vocablo clave y la tra- 
ducción. Los sujetos aprenden mejor si ellos mismos construyen su propio vínculo 
entre la palabra clave y la traducción, pero tienen dificultades para diseñar una pa- 
labra clave útil. En este aspecto, el tutor es muy efectivo. 

El programa con ayudas mnemónicas fue tan fructífero en el trabajo de laborato- 
rio que se empleó en la enseñanza de vocabulario en clases experimentales de 
ruso y español elemental en la Universidad de Stanford, entre 1974 y 1976. Los 
estudiantes mostraron un aprovechamiento superior: les agradó el método de la 
palabra clave y con frecuencia las pedían cuando no se proporcionaba ninguna. 
Dicho de otro modo, Jos estudiantes y Jos profesores recibieron favorablemente el 
método, Sin embargo, no todos los maestros de lengua extranjera simpatizan con 
los dispositivos mmemónicos, pues creen que complican lo que a la postre debe 
convertirse en un proceso de recuperación automática. Las personas que dominan 
un idioma raras veces comprenden qué grande y difícil es el problema del aprendi- 
zaje de vocabulario para el estudiante; además, los expertos en mnemotecnia afirman 
que los mediadores (palabras claves e imágenes) disminuyen con el uso conti- 
nuado de las palabras. En cualquier caso, la aplicación de la innemotecnia al apren- 
dizaje de un vocabulario extranjero, tiene probabilidades de aumentar en los futu- 
ros programas de estudio. 


Control del salón de clases 


Una infiuencia reciente de la psicología del aprendizaje en la educación ha sido la 
introducción de diversas técnicas de reforzamiento para ayudar a los maestros a 
fomentar un mejor ambiente de aprendizaje. Para que éste tenga lugar, los estu- 
diantes deben ser capaces de trabajar y estudiar sin interrupciones y distracciones 
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frecuentes. Cualquier maestro, no importa cuán liberal sea, quiere que sus alum- 
nos respeten algún conjunto de reglas; por ejemplo, llegar a clase a tiempo, es- 
cuchar con atención, abstenerse de hacer cuido o de distraer a los demás, trabajar 
en silencio, etcétera. Cuando un niño viola las reglas reiteradas veces, surgen 
proWemas, lo cual obliga al maestro a imponer castigos y convierte al salón de cla- 
ses en una colonia penal en miniatura. 

A partir de la década de los sesenta, en los salones experimentales, se usó una 
variedad de procedimientos de modificación de la conducta basados en técnicas de 
reforzamiento positivo, con el propósito de tratar con uno o dos niños alborotado- 
res o agresivos, En una situación estándar un maestro pediría a un psicólogo que 
lo ayudara con un niño problemático; el psicólogo, el profesor, y tal vez el prapio 
niño, discutirían la conducta conflictiva y se pondrían de acuerdo acerca de un me- 
dio objetivo para contarla y registrarla. Comienza entonces un periodo de registro 
de línea base, en el cual el maestro o el psicólogo investiga la frecuencia de la con- 
ducta problemática en una clase específica, durante una semana. Así, se introduce 
una contingencia de reforzamiento y se le explica al niño que ganará el elogio del 
profesor o un cierto número de puntos, fichas o recompensas tangibles si muestra 
ha “buena conducta” especificada (por ejemplo, trabajar en silencio en su pupitre), 
mientras que la mala conducta especificada se ignora o castiga mediante la pérdida 
de puntos o fichas. Si después de aproximadamente una semana el programa de 
reforzamiento no opera, se alteran o se ajustan ciertos procedimientos. Tal vez 
sea necesario introducir una conducta más simple, un reforzador más poderoso, o 
eliminar los reforzadores no intencionales para la conducta indeseable; el progra- 
ma continúa hasta que sus objetivos iniciales se cumplan. Entonces pueden es- 
tablecerse nuevas metas para desvanecer gradualmente los reforzadores 
extrínsecos mientras se acrecienta la calidad de la atención del niño o sus habilida- 
des de trabajo; después se instituyen nuevos programás de cambio conductual 
para esas metas. 

Estos programas se han aplicado con ciertas vartaciones a centenares de estu- 
diantes en muchos salones de clases, y los resultados revelan un éxito sorpren- 
dente (O'Leary y O'Leary, 1972). Las técnicas también se aplican satisfacto- 
riamente a otros grupos (niños ““normales”*, retrasados mentales y delincuentes) 
de una gran diversidad de niveles educativos (desde preescolar hasta el bachillera- 
to superior y la universidad) y una variedad de situaciones institucionales. Al co- 
mienzo, los estudios se centraban en hacer disminuir la conducta perturbadora (do 
cual es necesario para la instrucción ordenada), pero más tarde propendieron a la 
promoción de conductas académicas, como la ortografía, problemas de matemáti- 
cas, descripciones o composiciones verbales creativas, construcciones arquitectó- 
nicas novedosas, etcétera. 

Para dar una idea de estos programas, revisaremos detalladamente un estudio 
de Packard (1970) que ilustra un procedimiento de reforzamiento contingente de 
grupo. Se trata de un experimento efectuado en un salón de clases con niños 
de escuela primaria, en el cual un tipo general de conductas que se conocía como 
“prestar atención a Ja instrucción del profesor”? se moldeaba mediante el manejo 
de las contingencias de reforzamiento. Este experimento fue dirigido por un 
maestro durante las lecciones de lectura diaria de 30 minutos, con cuatro clases 
distintas (que abarcaban desde el jardín de niños hasta el sexto año de primaria). 

En primer término se instituía una economía de fichas en el salón. Los niños y el 
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profesor elaboraban una lista de reforzadores y acordaban cuántas fichas (de póquer) 
debía costar cada reforzador. Las actividades típicas de reforzamiento consistían 
en 10 minutos de acceso al juego con una máquina de escribir eléctrica, sentarse 
junto a un amigo en la siguiente clase, 15 minutos de juego en el gimnasio, servir 
como ayudante del maestro durante el próximo periodo, o 10 minutos de tiempo 
para tocar el piano. Estas actividades podían comprarse con fichas que el niño ga- 
naba al portarse bien, Así, las fichas servirían como reforzadores condicionales. 
Durante este tiempo, la frecuencia de línea base de las “conductas de no 
atención”” de los miembros de la clase se estimaba en diversas ocasiones, y eran 
consideradas. Las conductas de atención se definían con claridad y consistían prin- 
cipalmente en sentarse en silencio, mirar y escucharal maestro y estudiar las pro- 
pias lecciones; la conducta de no atención incluía ponerse de pie y caminar por el 
salón de clases, hablar con los compañeros, cantar, dormir, hacer garabatos, jugar 
con aviones de papel, etcétera. 

A continuación se instituía la contingencia de grupo y se le explicaba con detalle 
ala clase; se daban fichas a todos los alumnos si la clase prestaba atención al profe- 
sor por encima de un porcentaje especificado en la lección de lectura de 30 minu- 
tos, Las conductas específicas que contaban como “prestar atención” se repi- 
tieron a los niños cuidadosamente. 

Por último, una luz de indicio colocada en un lugar prominente sobre el escrito- 
rio del profesor, servía para informar a la clase que el maestro pensaba que todos 
le prestaban atención (luz verde), o que juzgaba que algunos niños estaban distraí- 
dos (luz roja). El maestro accionaba los interruptores de la luz verde o roja sin ha- 
cer comentarios acerca de los alumnos infractores. Los estudiantes sabían que 
mientras la luz permaneciera verde, un reloj de registro acumulaba “tiempo de 
atención” para la meta de la sesión; cuando la luz roja, la clase completa 
perdía tiempo y era probable que no consiguiera sus fichas para la lección de ese 
día. Las luces verde y roja servían como reforzadores condicionados y castigado- 
res, respectivamente. Huelga decir que había fuertes presiones de grupo (amena- 
zas de castigo) sobre los alumnos que no prestaban atención. 

Llamaremos “porcentaje de atención”? a la porción de una lección de 30 minutos 
durante la cual la clase completa prestaba atención. En un comienzo, el porcentaje 
de atención requerido para el reforzamiento de grupo, se establecía a un nivel muy 
bajo, pero después se estipulaba con criterios más estrictos mediante el maldea- 
miento. Al principio, cada niño recibía, por ejemplo, tres fichas si el porcentaje de 
atención del grupo superaba el 40% (o 12 minutos de la lección de 30 minutos). Si 
la clase excedía esa cantidad en un 10%, cada uno de los alumnos recibía una boni- 
ficación de 2 fichas. Estas siempre se entregaban al término de cada lección y el 
niño podía cambiarlas de inmediato por un reforzador de valor bajo o ahorrarlas 
para obtener después de algunos días un reforzador de alto valor, Luego de varias 
sesiones exitosas en un criterio, éste se incrementaría de modo que se requi- 
ñeran porcentajes más elevados del tiempo de atención grupal para el reforza- 
miento con fichas; además, si el grupo fallaba y llegaba al 5% por debajo del crite- 
rio del día, se castigaba restándole una ficha a cada niño. 

Este experimento de campo demostró un éxito espectacular para moldear la 
atención en el salón de clases y los hábitos de estudio. Cuando concluyó el proce- 
dimiento, la mayor parte de los grupos prestaban atención alrededor del 90%, 
rendimiento éste que era juzgado por observadores de la conducta así como por el 
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propio maestro. En el experimento, este procedimiento de reforzamiento explícito iba 
seguido de otros, que incluían instrucciones verbales simples para prestar aten- 
ción junto con regaños repetidos; sin embargo, cuando se eliminaron los reforza- 
dores de fichas, la atención de la clase muy pronto disminuyó a alrededor del 10 al 
20% del tiempo. Cuando los reforzadores de fichas y los de apoyo se reinstalaron, 
la atención conjunta de la clase retornó a un nivel del 90%. La extinción de la con- 
ducta de atender al maestro cuando se eliminaban los reforzadores extrínsecos 
planteaba la interrogante de si tales recompensas debilitan el interés que los niños 
tienen por el material del salón de clases (Lepper et al., 1977). 

Este estudio ilustra los principios del moldeamiento, los reforzadores condi- 
cionados y el castigo en un conjunto complejo de conductas, con las contingencias 
programadas para el grupo como un todo. El método tuva tanto éxito que la adop- 
taron otros maestros en la escuela, a pesar de su anterior resistencia a los progra- 
mas de control conductual. Es evidente que la atención al profesor y los buenos 
hábitos de estudio son necesarios para el aprendizaje, y su control es sumamente 
importante en la educación, Los estudios han demostrado que no sólo mejora el 
comportamiento de los alumnos, sino que también se incrementa su aprendizaje 
del material académico. Como el programa de modificación de la conducta les hacía 
prestar atención, comenzaron a aparecer más a menudo las consecuencias que 
normalmente asociamos con la educación: aprendizaje, pensamiento y creatividad. 

Abundan las ilustraciones de este tipo acerca de las aplicaciones prácticas del 
manejo de contingencias en las escuelas, instituciones e industrias. Las técnicas 
son efectivas para establecer comportamientos adecuados y hábitos de estudio 
incluso en las situaciones más difíciles, frecuentemente con grandes beneficios 
para otros niños y la comunidad. Un ejemplo de un problema serio de la vida esco- 
lar resuelto por los programas de modificación de la conducta es la violencia en la 
escuela, las peleas de pandillas, los ataques al profesor, la extorsión entre niños y 
pandillas, el vandalismo y la destrucción de la propiedad escolar. En las escuelas 
de los distritos urbanos pobres en los Estados Unidos, la violencia y el vandalismo 
han llegado a proporciones alarmantes. Por tal motivo, se diseñaron varios pro- 
gramas de modificación de la conducta para clases o escuelas enteras con el propó- 
sito de identificar y eliminar los reforzadores reales que mantienen la violencia y el 
vandalismo, y reemplazarlos con reforzadores para conductas socialmente aproba- 
das o pertinentes a la educación. Por ejemplo, en un estudio realizado por Mayer y 
Butterworth (1979) en 20 escuelas de distritos urbanos de Los Ángeles (grados 4, 
5, 6), se descubrió que los actos de vandalismo y violencia escolar en las escuelas 
experimentales se reducían en más del 50% en el transcurso de un año cuando se 
aplicaba un programa de modificación de la conducta en toda la escuela. Esta re- 
ducción tenía lugar durante un periodo en el cual el vandalismo en otras escuelas 
diltadinas se elevaba drásticamente. Un índice de diferencia es el costo anual de re- 
paraciones por vandalismo en las instituciones de control “no tratadas”, que era 
casi B veces mayor que en las escuelas experimentales, Además, el alcance de las 
conductas educativamente relevantes en los salones de las escuelas tratadas, se 
incrementaba de modo considerable, al igual que sus calificaciones en pruebas es- 
tándar de logro educativo. 

Esas aplicaciones de las técnicas de control conductual son totalmente apro- 
piadas y necesarias en una escala más amplia. Indican algunos de los beneficios 
que la sociedad puede recibir de las aplicaciones a gran escala de las ideas conduc- 
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tistas. Éstas comienzan a difundirse y se aplican a la industria (para fomentar la se- 
guridad), a los parques públicos (a in de evitar que en ellos se deposite basura), a la 
conservación de la energía (con el propósito de reducir su desperdicio en los hoga- 
res e incrementar el uso compartido de los automóviles), etcétera. Otra importan- 
te aplicación de la teoría de la conducta se refiere a la psicoterapia con neuróticos y 
psicóticos (véase el capítulo 9). 


TEORÍAS GENERALES DE LA INSTRUCCIÓN 


La enumeración anterior de las contribuciones a la educación por parte de varias 
teorías carece de una estructura coherente. Los educadores han argumentado 
que se necesita algún tipo de teoría de la instrucción a fin de orientar las aplicacio- 
nes, una teoría que recomiende o prescriba procedimientos educativos, progra- 
mas de estudio, y la secuencia de temas. 

Muchas de las primeras teorías de la instrucción estaban incorporadas en la 
teoría curricular, una disciplina dentro del estudio de la educación que intenta or- 
ganizar los materiales de instrucción de una manera ordenada para la enseñanza y 
el aprendizaje efectivos. Si hiciéramos un sumario de esta bibliografía (por 
ejemplo, McClure, 1971), nos alejaríamos mucho del tema; más bien nos interega- 
mos en algunos lineamientos recientes hacia los cuales los psicólogos dedicados a 
la teoría del aprendizaje o a los aspectos del desarrollo cognoscitivo han dirigido su 
atención con el propósito de elevar al máximo la instrucción cuando el tema de es- 
tudio y el aprendizaje guiado están bajo investigación. Por supuesto, lo que han 
planteado es importante para el currículum, ya que una teoría de la instrucción es, 
en cierto sentido, una teoría del desarrollo del programa de estudios. Sin embar- 
go, en la actualidad las teorías de la instrucción tienden a tratar con aspectos más 
limitados de la vida académica, que las teorías curriculares. 

El desarrollo del aprendizaje programado, en el cual los psicólogos experimenta- 
les desempeñaron un importante papel, constituía un claro incentivo para una teo- 
ría de la instrucción; sin embargo, un programa así tenía que reflejar el contenido 
real del aprendizaje escolar y no quedar limitado a los materiales artificiales del la- 
boratorio. Varios psicólogos educativos que durante la Segunda Guerra Mundial 
estudiaron a fondo los problemas reales de entrenar a pilotos de aviones de conr 
bate, o de enseñar idiomas exóticos, deseaban aplicar algunas de las lecciones que 
habían aprendido fuera de las fuerzas armadas. El resurgimiento del interés por 
los avances educativos después del lanzamiento del Sputnik, en 1957, ha hecho 
que los académicos de las áreas de matemáticas, física, biología y otros campos in- 
tervengan en el diseño de los materiales de instrucción. Los educadores prufesio- 
nales dieron la bienvenida a estos nuevos aliados, y el encuentro originó un consi- 
derable trabajo de colaboración. 

La teoría de la instrucción todavía no ha dado lugar a un sistema aceptado y per- 
feccionado por el constante intercambio entre la teoría, el experimento y el diálo- 
go. Así las cosas, creemos que lo conveniente es proporcionar algunas ¡lustracio- 
nes. Con este propósito hemos escogido tres enfoques, asignados a los tres teóri- 
cos que los proponen, ninguno de los cuales está comprometido con una teoría 
global del aprendizaje como se ha descrito en capítulos anteriores. Más que 
opuestas, tales perspectivas son complementarias y no tratan exactamente los 
mismos problemas. 
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Análisis jerárquicos de tareas, de Gagné 


Robert M. Gagné es un asociacionista formado en la tradición del aprendizaje 
verbal (véase el capítulo 6), que ha pasado del estudio de los problemas básicos en 
el laboratorio a las tareas prácticas del adiestramiento en la fuerza aérea durante la 
Segunda Guerra Mundial. donde trabajó (aunque no de forma exclusiva) en varios 
dispositivos para simular la tarea del piloto. El investigador emergió de esta expe- 
fiencia con la preocupación de hacer que los principios tradicionales del aprendiza- 
je fueran más aplicables a las tareas de adiestramiento. Pensaba que para ello se 
necesitaban dos cosas: la primera, un análisis psicológico de las numerosas activi- 
dades componentes y de su montaje que un estudiante requiere para ejecutar al- 
guna habilidad educativa compleja. Esto conduce a su idea de las jerarquías de 
tarea-habilidad, que discutiremos más adelante, y que nos dicen cómo hacer se- 
cuencias del adiestramiento de algunas habilidades antes que otras; segundo, esos 
análisis identifican para los investigadores un cierto número de tipos de aprendiza- 
je, de modo que Gagné los estableció en una lista como la que aparece en el cuadro 
15.1, dispuestos en orden de complejidad creciente. Ya hemos visto estos tipos 
de aprendizaje bajo otras denominaciones; por ejemplo, el tipo 1 es el condiciona- 
miento clásico, los tipos 2 y 3 corresponden al condicionamiento instrumental, y 
los tipos 4 a 7 constituyen aprendizajes de discriminación. Resulta muy claro que 
al haber establecido tantos tipos distintos de aprendizaje, Gagné encontraba rela- 
tivamente fácil describir muchos de ellos de acuerdo con los tipos propuestos. 

Es probable que la mayor contribución del citado investigador fuera proponer 


CUADRO 15.1. Los ocha tipos de aprendizaje de Gagné. 
(Adaptado de Gagné, 1970). 


tipo 
1. Aprendizaje de señal 


Breve descripción 


La respuesta condicionada clásica de Pavlow, en la 
Cual el individuo aprende a dar una respuesta difusa 
a una señal 


2. Aprendizaje de 


estimulo-respuesta 


. Encadenamiento 


El ronexionismo de Thorndike, la operante discriminada 
de Skinner, llamada a veces respuesta instrumental 

Se encadenan dos o más conexiones de estimulo- 
respuesta 


4. Asociación verbal Cadenas que son verbales 
5. Discriminación Identificar respuestas a los estímulos que se aseme- 
múltiple jan unas a las otras, de modo que ocurre alguna ¡e 
terferencia 
6. Aprendizaje de Una respuesta común para una clase de estímulos 
conceptos 
7. Aprendizaje de reglas Una cadena de dos o más conceptos; reflejada en 
una regla como "Si A. entonces B”. donde A 
Y 8 son conceptos 
8. Solución de problemas Interviene el pensamiento; los principios se com- 


binan de acuerdo con una “regla de orden su- 
perior” 
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Demostrar * mitades” de 
un cerqur:o de objetos. 
50mo d0s subconjunios 
iguales, “tercios” como tres 
subconjuntos ¡g..ales 


Constru subeonpuatos 
que sean iguales, 
al pa"ear objetos. 
uns a cada 
sudconpu tia 


Idemtiticar dos subconjuntos 
aparentemente iguales 
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Figura 15.4. Jerarguia de aprendizaje de una habilidad matemática para niños que no 
asisten a la guarderia infantil (tomada de Cagné, 1970). 


jerarquías de habilidades y reglas en varias tareas académicas. Ha ilustrado la or- 
ganización jerárquica de la instrucción escolar, conforme a sus tipos, para las ma- 
temáticas, las ciencias, las lenguas extranjeras y el inglés (1965, págs. 175 a 203; 
1970, págs. 246 a 274). 

En la figura 15,4 se describe un ejemplo de una jerarquía de habilidades para un 
niño en edad preescolar que aprende a dividir objetos en mitades o tercios iguales, 
y esta habilidad es un requisito esencial para comprender conjuntos y otros con- 
ceptos numéricos de la aritmética. Cabe preguntarse lo siguiente: ¿qué opera- 
ciones y discriminaciones debe hacer un niño para realizar con éxito esa tarea? 
Los análisis demuestran “que el niño debe ser capaz de: 1. identificar dos subcon- 
juntos aparentemente iguales de un grupo total como 'mitades”, y tres de tales 
subconjuntos como “tercios” (un concepto definido); y 2. construir subconjuntos 
verdaderamente iguales al parear objetos con cada conjunto funa regla de procedi- 
miento)” (Gagné, 1970, pág. 253). El análisis de la habilidad de identifcar mitades 
o tercios requiere que el niño comprenda los conceptos de 2 y 3; el análisis de la 
construcción de subconjuntos iguales sugiere requisitos esenciales de ''distribuir 
objetos, uno a cada subconjunto””, y "distribuir los objetos sobrantes, uno a cada 
subconjunto”. Esta jerarquía es como una receta de lo que hay que hacerse para 
sintetizar una conducta compleja, e indica la progresión en la cual deberían ense- 
ñarse las subhabilidades. Estas jerarquías deberán construirse para todas las habi- 
lidades educativas. 
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Consideremos otra jerarquía propuesta por Gagné (1965) para la lectura (véase 
la figura 15.5). Aunque ese perfil tiene cierta posibilidad, de ningún modo está cla- 
ro Que pueda diseñarse una secuencia de instrucción basándose en él. Asimismo, 
la noción básica de que los pasos inferiores de la jerarquía deben dorinarse antes 
de que se aprendan los superiores quizá no sea siempre la mejor estrategia; puede 
ser muy bien que haya un tipo de desarrollo cíclico en el aprendizaje, en el cual las 
diversas etapas deben ampliarse y perfeccionarse reiteradas veces (como en el 
desarrollo del vocabulario). 

Gagné continuó trabajando en estos problemas, y con la ayuda de Briggs se abo- 
có directamente a la tarea de diseñar secuencias de instrucción (Gagné y Briggs, 
1974). Aquí trató de modo explícito con el probiera del curriculum. Le resultó útil 
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Figura 15.5. Una estructura de aprendizaje para las habilidades básicas de la lectura, 
(tomada de Cagne, 1965) 
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referirse a una jerarquía de niveles; por ejemplo, al hacer una secuencia de un cur- 
so, un tema dentro de ese curso, una lección dentro de ese tema, un componente 
dentro de esa lección. Ninguno de los pasos puede pasarse por alto, ya sea que 
todo se escriba o no al planear el curriculum. Para mantener esta discusión dentro 
del contexto de la teoría del aprendizaje, podemos considerar cómo aplicó Gagné 
los principios de secuencia a algunos resultados expresados como productos del 
aprendizaje, en vez de conocimiento específico acerca de algún tema de estudio, 
Una de las tablas sumarias de Gagné aparece en el cuadro 15.2. 

Es evidente que en cualquier teoría de la instrucción debe permanecer un gran 
sustrato de empirismo en la decisión acerca de cuánto tiempo y esfuerzo debe de- 
dicarse a cada paso de una secuencia. El punto esencial es que Gagné ha descu- 
bierto que el principio jerárquico resulta útil para moverse de los principios del 
aprendizaje a la secuencia de instrucción. En este sentido, la jerarquía es la base 
de su enfoque de una teoría de la instrucción. 


La teoría del desarrollo cognoscitivo, de Bruner 


Jerome S. Bruner es un psicólogo cognoscitivista que se interesa fundamental- 
mente en el desarrollo de las capacidades mentales. Ejerció un fuerte inllujo en la 
educación con la publicación de su libro The process of education (1960), que fue el 
resultado de una conferencia dedicada a los problemas educativos a la que asis- 
tieron muchas personas que no se habían identificado con la educación profesional. 
Más tarde, Bruner propuso algunos teoremas acerca de la instrucción, ilustrados 
con la enseñanza de las matemáticas, y avanzó hacia una teoría de la instrucción en 
una colección subsecuente de ensayos (Bruner, 1966). En estos últimos señala 
que una teoría de la instrucción es prescriptiva, en el sentido de que propone 
reglas para adquirir conocimiento o habilidades, y proporciona técnicas para medir 
o evaluar los resultados. También es normativa, puesto que establece metas y 
trata con las condiciones para satisfacerlas. 


Una teoría de la instrucción, en suma, se interesa por que lo que uno desea enseñar 
pueda aprenderse mejor, con un mejor aprendizaje que no se Emite a lo descriptivo. 

Esto no quiere decir que las teorías del aprendizaje y del desarrollo sean irrelevantes 
para una teoría de la instrucción. De hecho, una teoría de la instrucción debe preocuparse 
por el aprendizaje y por el desarrollo, y debe ser congruente con aquellas teorías del 
aprendizaje y el desarrollo a las cuales se suscriba (Bruner, 1966, pág. 40). 


Seguidamente especifica cuatro características que una teoría de la instrucción 
debe poseer: 


1. Predisposición para aprender. Una teoría de la mstrucción ha de interesarse por las 
experiencias y los contextos que tenderán a hacer que el niñio esté deseoso y sea capaz de 
aprender cuando entre en la escuela. 

2. Estructura del conocimmento. Especificará las formas en que un conjunto de conoci- 
mientos deben estructurarse a fin de que el aprendiz los entienda más fácilmente. 

3. Secuencia. Habrá de especificar las secuencias más efectivas para presentar los ma- 
teriales. 

4. Reforzamiento. Tendrá que determinar la naturaleza y el espaciamiento de las re- 
compensas, moviéndose desde las recompensas extrínsecas hasta las intrínsecas. 
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Cada uno de estos puntos requiere de elaboración (parte de la cual el mismo 
Bruner proporciona), particularmente en lo que toca a las diferencias individuales 
entre los niños de todas las edades, las discrepancias que acompañan al crecimien- 
10, las diferencias en estructura dentro de varios campos del conocimiento, la flexi- 
bilidad necesaria de la secuencia para satisfacer diferencias individuales en la 
tasa de aprendizaje y en las preferencias, etcétera. Bruner propone que con la 
comprensión suficiente de la estructura de un campo de conocimiento, algo que se 
anticipa a los conceptos posteriores y más avanzados puede enseñarse de modo 
apropiado a edades mucho más tempranas: “*Cualquier tema se puede enseñar de 
modo efectivo y de alguna forma intelectualmente honesta a cualquier niño, en 
cualquier etapa de su desarrollo” (1960, pág. 33). 

La mención del desarrollo en la teoría de Bruner alude a su interés en el deser- 
volvimiento cognoscitivo, que originalmente fuera estimulado por Piaget. Esto lo 
ha llevado a recalcar tres modalidades de representación en una secuencia del de- 
sarrollo: la enactiva, la icónica y la simbólica (19646). La modalidad enactiva es el 
aprendizaje por medio de la acción, un aprendizaje que esencialmente se realiza 
sin palabras, como el de montar en bicicleta. La modalidad icónica se basa en la 
representación por medios perceptuales (de allí el *“icono”” o imagen que repre: 
senta algo). Un mapa mental que nos permite seguis una ruta desde donde nos en- 
contramos hasta el punto al cual nos dirigimos constituye una representación icó- 
nica. Por último, la modalidad simbólica permite la traducción de la experiencia en 
palabras, y éstas, a su vez, a la postre permiten los tipos de transformaciones que 
en las etapas posteriores tienen mucho interés para Piaget. En relación con la 
teoría del aprendizaje, Bruner observa que gran parte del condicionamiento o 
aprendizaje E-R parece apropiado para la modalidad enactiva; la psicología de la 
Gestalt se interesaba en gran medida por la modalidad icónica, y la nueva inquietud 
por la modalidad bngúística hace intervenir a los psicolingúistas y a muchos otros, 
además de Piaget. 

AJ igual que todas las personas que se inclinaron por los problemas concretos de 
la instrucción, Bruner insiste en los pasos empíricos requeridos para que la teoría 
pueda prescribir la práctica. La explicación psicológica, en el nivel de la práctica, 
debe exponer las formas en que los niños tratan en verdad con los problemas a los 
que se enfrentan; Bruner cree, por ejemplo, que la teoría de Piaget, con su gran én- 
fasis en la epistemología, es demasiado formal como para proporcionar una descrip- 
ción psicológica de los procesos de! crecimiento (Bruner, 1966, pág. 7). Aunque las 
propuestas de Bruner $on interesantes e influyeron en las actitudes y el pensamien- 
to de los educadores, no fueron complementadas todo lo necesario por la investiga- 
ción con programas de instrucción. 


El análisin de decisión teórica, de Atkinson, 
para mejorar e) aprendizaje 


Richard C. Atkinson llegó a la psicología de la instrucción gracias a su interés 
par la teoría del aprendizaje matemático (Atkinson, Bower y Crothers, 1965), que 
aplicó a una forma de programación que denominó instrucción con ayuda de com- 
putadora (ZAC), A raíz del empleo de la computadora para la enseñanza de lectura 
y ortografía en las escuelas Atkinson se interesó en el contexto más amplio de la 
instrucción, incluyendo cuestiones prácticas como el tiempo que el alumno tendría 
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jue pasar con la computadora de enseñanza y el que debería dedicarle al profesor, 
a] costo de la instrucción computarizada, etcétera. Con la ayuda de varios colabo- 
sadores, ha desarrollado ideas acerca de la secuencia de las tareas educativas y la 
forma en que los estudiantes deberían dividir su tiempo. (Atkinson, 1972; Atkin- 
son y Paulson, 1972). 

El autor propone cuatro criterios que han de observarse para obtener una deri- 
ración exacta de una estrategia óptima de instrucción: 


a) disponer de un modelo del proceso del aprendizaje. 

bd) determinar las acciones admisibles de instrucción. 

c) especificar los objetivos de instrucción. 

d) contar con una escala de medición que permita asignar costos a cada uno de 
los objetivos de instrucción. 


En esta etapa es posible seguir el modelo de Atkinson para tareas específicas de 
enseñanza; el conjunto de tales modelos habrá de conducir a una teoría más gene- 
ral de la instrucción. El modelo es, de hecho, un caso especial de la teoría del 
control óptimo tal como se ha desarrollado en los campos de las matemáticas y de 
la ingeniería (Kalman, Falb y Arbib, 1969), 

Como un primer ejemplo, Atkinson utiliza los datos de la instrucción inicial de 
lectura en salones de clases regulares, en los cuales la ZAC complementa el traba- 
jo del profesor (Atkinson y Fletcher, 1972). La tarea de mejoramiento que se es- 
tablece consiste en usar la computadora de la forma más eficiente, en razón de una 
cantidad total y específica de tiempo de computadora asequible, y con el conoci- 
miento de que no todos los alumnos se encuentran en el mismo nivel para comen- 
zar v aprender al mismo ritmo. Los cuatro criterios enumerados pueden satisfa- 
cerse, al menos provisionalmente. Primero, se dispone de varios modelos útiles 
del aprendizaje: los modelos de un elemento o de aprendizaje lineal (véase el 
capítulo 6) han resultado efectivos para este propósito; segundo, las acciones de la 
instrucción ya se han programado en la computadora, de modo que todo lo que se 
necesita es asignar entre los alumnos, de una forma óptima, el tiempo de la compu 
tadora, El tercer criterio —el objetivo de la enseñanza— enseguida se discutirá 
con mayor profundidad y, en lo que toca al cuarto, los costos y las utilidades 
pueden establecerse con facilidad, ya que el tiempo de la computadora (y por ende 
su costo) es una constante, y la utilidad puede definirse como el aprovechamiento 
medido por la prueba de lectura al final del año. 

Dadas las diferencias individuales en el aprendizaje, los objetivos de instrucción 
para una clase, tal vez no sean iguales que aquellos que se fijan para un individuo. 
Atkinson considera cuatro posibles objetivos: 


A) elevar al máximo el aprovechamiento medio de la totalidad de la clase. 

b) reducir al mínimo la varianza en el aprovechamiento de todo el grupo escolar. 

c) elevar al máximo el número de estudiantes con calificaciones dentro del pro- 
medio para su grado, a superiores a él. 

d) elevar a] máximo el aprovechamiento medio sin aumentar la varianza por en- 
cima de lo que habría resultado sin la ZAC. 


Es muy fácil hacer declaraciones apresuradas acerca del éxito de una escuela en 
comparación con otra, basadas tan sólo en el aprovechamiento medio en algún tipo 


$638 


Porcentaje de ganancia relativa 


Figura 15.6. Ca- 
nancias o pérdi- 
das esperadas al 
maximizar cada 
uno de los cuatro 
objetivos (toma- 
da de Atkinson, 
Objetiva de la instrucción 1972) 


de prueba, Tal aseveración se fundamentaría en el objetivo a), pero obsérvese 
que podría significar que los procedimientos favorecerían a los estudiantes más 
prometedores, al presionarlos y permitir que aquellos con mayores probabilidades 
de fracasar terminaran en verdad fracasando. O, con el fin de hacer que todos los 
alumnos finalicen en un nivel más o menos similar (una interpretación romántica 
del idea) democrático), podría escogerse el objetivo 5), con la consecuencia de que 
los aprendices más rápidos se detendrían, y todo el esfuerzo se dedicaría a los más 
lentos, 

Al usar las tasas de aprendizaje de los estudiantes observados en anteriores 
aplicaciones del programa de enseñanza computarizado, fue posible simular un 
experimento en la computadora para saber cuáles serían las consecuencias de 
adoptar cada uno de Jos cuatro objetivos, sin llevar a cabo el experimento en las 
escuelas. Los resultados aparecen en la figura 15.6, en la cual se trazan las ganan- 
cias (o pérdidas) al mejorar cada objetivo. 

Si se adoptara el objetivo a), que requiere de una ganancia media máxima, los 
promedios de lectura se elevarían hasta el 15% al término del año, pero la varian- 
za también ascendería aproximadamente el 15%. Esto significa que la ganancia 
promedio se produciría a expensas de la mayor dispersión entre los estudiantes 
más exitosos y los menos, un resultado que difícilmente puede considerarse nota- 
hle. Si se escogiera el objetivo b) o el e), el aprovechamiento promedio 
disminuiría, una consecuencia de restringir a los aprendices más rápidos con el 
propósito de reducir la variabilidad. El objetivo d) que requiere de un programa 
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que le asigne un lapso igual a cada estudiante, eleva la media a alrededor del 8%, 
menos que el objetivo 4), pero con el desafortunado efecto secundario de incre- 
mentar la variabilidad, Por lo tanto, en esta comparación, el ubjetivo d) parecería 
el más aconsejable. Aquí, el punto importante consiste en demostrar la manera en 
que un modelo de decisión teórica puede conducir a decisiones prácticas. 

Como otra ilustración del enfoque en acción, describiremos brevemente un se- 
gundo ejemplo tomado de Atkinson (1972): el aprendizaje de un vocabulario de 
lengua extranjera (alemán) en estudiantes universitarios de habla inglesa. Se 
emplearon tres estrategias de enseñanza en una comparación experimental: una 
estrategia de orden aleatorio, en la cual se presentan palabras alernanas en orden 
aleatorio; una estrategia de aprendiz controlado, en la que el alumno decide qué re- 
activos requieren más práctica y que. por lo tanto, deberán presentarse para estu- 
dio; y una estrategia de respuesta sensible, en la cual la computadora se programa 
para presentar materiales de acuerdo con los éxitos y fracasos anteriores del estu- 
diante, en concordancia con un análisis de decisión teórica de la tarea. Á grandes 
rasgos, la estrategia presenta para estudio aquellos reactivos del vocabulario en 
los cuales el estudiante se ha equivocado, y deja aquellos que ya domina. 

La computadora controla la enseñanza en una sesión de instrucción de aproxi- 
madamente dos horas y una sesión de prueba demorada, más breve, una semana 
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Figura 15.7. Proporción de respuestas correctas con tres estrategias de aprendizaje 
(tomada de Atkinson, 1972). 
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después. Para permitir la comparación de las tres estrategias, la presentación se | 
hace de la siguiente manera: se muestra una lista de doce palabras alemanas (una : 
de siete listas), y se escoge un reactivo de lista para prueba y estudio. Después de | 
esta selección, el estudiante intenta una traducción y recibe retroalimentación | 
acerca de la versión correcta. Este reactivo se elige al azar, a criterio del apren- | 
diz, o de acuerdo con el modelo designado corno óptimo. Á cada sujeto se le asigna ' 
uno de estos procedimientos de tratamiento. La prueba demorada, que es la mis- 
ma para todos los estudiantes, comprueba un vocabulario completo de 34 palabras 
que integra las siete listas. Los resultados, como se presentan en la figura 15.7, 
fueron los pronosticados, y la estrategia de respuesta sensible fue la más exitosa 
en la prueba de criterio (demorada). Los diferentes ordenamientos de las condk 
ciones fueron los pronosticados, ya que la estrategia de respuesta sensible re- 
quiere de la mayor práctica durante las sesiones de instrucción con los reactivos 
que originan más problemas; la estrategia de aprendiz controlado consiste en ha- 
cer algo similar a lo indicado, pero es menos eficiente; la estrategia aleatoria igno- 
ra por completo las dificultades específicas del aprendiz. El carácter óptimo de la 
estrategia de respuesta sensible se deriva de una variante de] modelo de aprendi- 
zaje de un elemento. Tal variante se basaba en la concepción de que cualquier aso- 
ciación de vocabulario en lengua extranjera puede ser desconocida (estado U)), en 
el almacén temporal de la memoria (estado 7), o en el almacén de la memona rela- 
tivamente permanente (estado P). El modelo del aprendizaje explica con precisión 
los cambios de un estado a otro y puede emplearse para derivar ecuaciones para 
las probabilidades de encontrarse en cada uno de los estados para cada uno de los 
reactivos al comienzo de cualquier ensayo, dados algunos parámetros empíricos y 
el historial de respuesta del estudiante (Atkinson y Crothers, 1964). Entonces se 
establece en la computadora el procedimiento computarizado. 

Este ejemplo es un tanto incompleto desde el punto de vista de la teoría de ins- 
trucción totalmente práctica, en el sentido de que se acerca mucho a un experl- 
mento típico de laboratorio acerca del aprendizaje, que se realiza por un breve lapso 
y con estudiantes universitarios que no están inscritos en el curso de idiomas. Sin 
embargo, tiene la virtud de usar materiales escolares pertinentes (el vocabulario 
de un idioma extranjero), y de someter a prueba algunas teorías acerca de la ins- 
trucción, al comparar la elección del estudiante con una elección sistemática en el 
aprendizaje por secuencia. En esta situación, el estudiante no es la guía más efi- 
ciente para mejorar su propio aprendizaje. 

En trabajos más recientes, Malone, Macken y Suppes (1979) han estudiado el 
problema de la forma de asignar una limitada cantidad de tiempo de instrucción por 
computadora en un grupo (o clase) de estudiantes que se desempeñan y aprenden 
en niveles distintos, con el propósito de elevar al máximo el aprendizaje grupal. 
Los investigadores ajustan primero una fórmula matemática a la ubicación de gra- 
do esperada de cada estudiante en pruebas de aprovechamiento (para matemáti- 
cas o lectura), en función del tiempo que el alumno ha pasado trabajando en las lec- 
ciones programadas. Las diferencias individuales aparecen en las constantes b y € 
de la función de potencia: * 


GP(D = bp +<c 


donde 1 significa los minutos de aprendizaje en la computadora; GP (£) es el nivel 
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de colocación de grado; c es algo así como un nivel inicial; y bes como una tasa de 
aprendizaje. Los investigadores efectuaron una simulación, similar a la que conduce 
alos resultados en la figura 15.6, que investigaba Jos cuatro distintos criterios 
mencionados, y las estrategias de asignación estudiantil de tiempo de computado- 
ra que ellos dictaban. Los resultados fueron reconfortantes porque demostraron 
que dentro de límites razonables, las diferentes formas de asignar tiempo de compu- 
tadora a los estudiantes lentos y a los veloces arrojaban relativamente poca dife- 
rencia en la cantidad global de aprendizaje para la clase. La política más segura y 
con claros beneficios consistía tan sólo en incrementar el tiempo JAC disponible 
para la clase considerada como un todo. 

La teoría de Atkinson derivada del trabajo con la computadora es, desde luego, 
solo uno entre varios enfoques (los otros no dependen de la computadora) del 
problema de cómo tratar de modo efectivo las diferencias individuales en el apren- 
dizaje. Por ejemplo, Carrol (1963a) propuso un modelo en el cual se asignaría al in- 
dividuo el tiempo suficiente para lo que necesitaba aprender como información bá- 
sica para la siguiente etapa, y se interpretaba la aptitud en una tarea esencialmente 
como el tiempo requerido para que el individuo la dominara. Bloom y sus colaborado- 
res adoptaron este enfoque y lo convirtieron en un plan de instrucción que se co- 
noce como aprendizaje de maestría, basado en el principio de que el aprendiz 
debe lograr la maestría en una etapa, antes de pasar a la siguiente (Bloom, 1968; 
Block 1971). Otro enfoque es el denominado instrucción prescrita individualmente 
([PD, desarrollado por Glaser y sus asociados, en Pittsburgh (Lindvall y Bolvin, 
1967; Lindval y Cox, 1969). Al usar materiales dispuestos en unidades progresi- 
vamente más difíciles, la escuela que utiliza la /P] intenta resolver las diferencias 
individuales en matemáticas, lectura y ciencia al hacer que cada estudiante trabaje 
con los materiales apropiados después de que haya efectuado un examen de ubica- 
ción que permite prescribir la unidad adecuada, Otro punto de vista es el que se 
conoce como interacción entre aptitud y tratamiento ([AT), el cual propone que las 
diferencias individuales se resuelvan mediante distintos enfoques de la instrucción 
para los estudiantes de diferentes aptitudes (por ejemplo, Cronbach, 1967; Cron- 
bach y Snow, 1969). El adaptar la instrucción al individuo es un problema básico en 
el diseño del curriculum y cabe esperar que se planteen varios enfoques para sa- 
tisfacer esta necesidad. Las tres teorías de la instrucción aquí presentadas (el mo- 
delo jerárquico, de Gagné; el modelo del desarrollo cognoscitivo, de Bruner; y el 
de mejoramiento de decisión teórica, de Atkinson) ilustran las investigaciones 
contemporáneas tendientes a conformar una teoría prescriptiva de la instrucción. 
Hasta la fecha, estas teorías han ejercido relativamente poca influencia en el dise- 
ño de los curriculum, la redacción de textos o la secuencia de cursos en los siste- 
mas escolares. 


AUXILIARES TECNOLÓGICOS EN EL 
ADIESTRAMIENTO Y LA INSTRUCCIÓN 


Para desarrollar su labor, los profesores siempre han usado los recursos auxi- 
lares de que disponen: pizarras, pizarrones, bibliotecas, libros de texto, cuader- 
nos de trabajo, laboratorios, escenarios, patios de recreo. En el transcurso de los 
años, han aparecido diversas innovaciones pero la tecnología educativa como tal 
no es nueva. Lo que sí es reciente es el ritmo al que han surgido las propuestas. 
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Ahora estamos en una mejor posición para preguntar qué investigaciones nos in- 
forman acerca de la efectividad de esos instrumentos. Á su tiempo, y debido a 
la seguridad con la que avanzan, estás innovaciones también pueden contribuir-a la 
teoría de la instrucción, como hemos visto en la sección anterior al referimos al 
trabajo de Atkinson con la computadora. 


Simuladores 


Gagné (19625) ha reseñado la fructífera aplicación de las máquinas de simulación 
en el adiestramiento del usuario, no sólo la de los simuladores de aviones para el 
entrenamiento de los pilotos, sino también para capacitar al personal de control de 
vuelos y operadores de torre de control, operadores de dirección de cohetes y 
técnicos de otros tipos. Gagné señala que no es propiamente el aparato lo que se 
simula, sino las operaciones o tareas relacionadas con él: los procedimientos, las 
identificaciones, la localización de averías, las habilidades para trabajar en equipo, 
como sucede en Ja comunicación de información. 

Gagné cree que el uso educativo de los simuladores debería encontrarse ya en 
etapas muy avanzadas de instrucción, como ocurre en la capacitación de los técni- 
cos civiles, y tal vez en algunos tipos de evaluación de la ejecución (por ejemplo, la 
evaluación de la habilidad de conducir un automóvil). 

Las generalizaciones, en lo que se refiere a la teoría del aprendizaje, se dirigen 
más hacia el análisis de la tarea que a los procesos de aprendizaje implícitos, aun- 
que desde luego deben considerarse los problemas del grado de semejanza que 
exista entre la situación real y la simulada. Sin embargo, este es en esencia un asusto 
práctico, y las teorías de la generalización y la transferencia no lo ayudan mucho. 


Las películas y la televisión 


El cine y la televisión se asemejan en el sentido de que ambos medios emplean 
imágenes animadas con sonido. Por supuesto, las películas se presentan en apara- 
tos de televisión en circuito cerrado, con la ventaja de que no exigen oscurecer 
totalmente la habitación, y de que pueden emplearse proyectores lejanos o graba- 
doras de video tape. La televisión también puede ser ''en vivo””, ya sea desde una 
fuente lejana o sobre el circuito cerrado procedente de fuentes cercanas, incluso 
desde el propio escritorio del profesor, si es que éste desea que un salón lleno de 
alumnos mire por encima de su hombro mientras él lleva a cabo una disección o 
ejecuta alguna otra demostración. Aquí no nos interesamos en saber cómo puede 
hacerse más conveniente el equipo, a pesar de que esto tiene algo que ver con su 
uso, más bien nos interesa el tipo de enseñanza que se lleva a cabo con los auxilia- 
res audiovisuales mencionados. 

En una revisión de las investigaciones acerca del aprendizaje con películas, Ho- 
ban (1960) clasificó los resultados de unas 400 investigaciones sobre las películas 
de enseñanza en tres zonas de certidumbre respecto a los resultados: baja, inter- 
media y alta. Para lograr una certidumbre alta, los resultados tenían que satisfacer 
cuatro criterios: 1. ser intuitivamente razonables; 2. haber sido reseñados por un 
investigador competente e imaginativo; 3. estar relacionados con alguna formulación 
sistemática; y 4. La investigación debe haber sido repetida. Los grados restantes 
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de certidumbre se referían a los resultados que no cumplían estos cuatro requisitos, 
Seomitirán los resultados de certidumbre baja e intermedia (las áreas en las cuales se 
necesitan imperiosamente más investigaciones), y se examinarán aquellos que en 
opinión de Hoban alcanzan los criterios de alta certidumbre: 


1. las personas aprenden con las cintas cinematográficas. 

2. el aprendizaje con películas varía en cantidad según las características de la 
audiencia; por ejemplo, la edad y la educación formal. 

3. el volumen de lo que se aprende con las películas puede aumentarse median- 
te el uso de uno o más mecanismos y métodos comprobados, a saber: 


a) redundancia. Los realizadores de películas (y los profesores de inglés) hacen 
del empleo de la redundancia una lucha penosa y, según Hoban, puede de- 
mostrarse que la repetición de la información, incluso la de películas comple- 
tas, ayuda a incrementar el aprendizaje. 

b) participación. Si se alienta la actividad del estudiante —como la de responder 
a preguntas que se presentan durante la película— mejorará el aprendizaje, 
en especial si existe retroalimentación que le haga saber si ha respondido 
bien o mal, La experimentación ha demostrado que éste no es sólo un recur- 
so motivacional (para estar seguro de que el estudiante advierte lo que 
ocurre), sino que se obtiene un efecto de práctica genuina al dar respuestas 
pertinentes. 

aparatos y métodos para dirigir la atención, Una película puede usar flechas 

que aparezcan sobre una gráfica (o imagen) para llamar la atención hacia algu- 

na característica, o ayudar de otro mado a que el estudiante descubra la in- 
formación que desea. Los aparatos y métodos de enseñanza apropiados 
incrementan la eficacia del aprendizaje con peliculas. 


€, 


X 


Para los psicólogos del aprendizaje éstos no son resultados novedosos; es más im- 
portante la forma en que estos principios se integran en detalle, al tener en consi- 
deración la estructura de lo que se enseña. 

La televisión se destacó rápidamente como un posible medio de enseñanza, des- 
pués de que los aparatos receptores se hicieron asequibles en los hogares y en las 
escuelas, y luego de que el desarrollo de los satélites artificiales permitió dirigir 
programas a lugares muy lejanos, incluyendo áreas en desarrollo en donde los 
libros de texto y los profesores fueran escasos. En una revisión profunda de 
los estudios acerca de la efectividad de la televisión en la instrucción, Chu y 
Schramm concluyeron: 


...se ha hecho evidente que ya no hay razón para preguntarse si la televisión educativa 
sirve como eficiente instrumento de aprendizaje. Esto no quiere decir que siempre lo sea, 
pero abundan las pruebas de que prede serlo, y de que en circunstancias favorables lo es. 
Esta evidencia proviene de muchos países, de estudios de todos los niveles cranológicos, 
desde los niños en edad preescolar hasta los adultos, y de una gran variedad de temas de 
estudio y objetivos de aprendizaje (1967, pág. 98). 


Estos investigadores señalan ciertas ventajas peculiares, por ejemplo, que la te- 
levisión permite que varias clases compartan a un buen profesor; que proporciona 
experiencias de una variedad y calidad que de otra forma serían imposibles, y que 
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puede llevar la enseñanza a regiones en las cuales no hay escuelas. Los programas 
de televisión educativa dirigidos a las áreas rurales apartadas han sido particular- 
mente útiles en el Tercer Mundo. La televisión también proporciona tiempo libre 
al profesor para que trabaje con grupos más pequeños y pueda brindar asesora- 
miento individual. La principal desventaja es que se trata de un sistema en un sola 
sentido, por lo cual se han realizado algunos experimentos con sistemas de con- 
testación o respuesta (Greenhill, 1964), pero las consideraciones de costo no Jos 
han hecho factibles, El mejor complemento de la televisión es un tutor local que 
amplíe Jos puntos del programa, conteste preguntas, motive y refuerce el trabajo. 


El laboratorio de idiomas 


El impulso a la enseñanza de idiomas se inició durante la Segunda Guerra Mun- 
dial, y no se escatimaron esfuerzos para facilitar ese aprendizaje. En este punto 
cabría esperar una remuneración para la educación, ya que la enseñanza de idio- 
mas siempre ha sido una de las tareas escolares estándar, aunque en ocasiones se 
haya vacilado entre el hecho de enseñar el idioma para que se hable a enseñarlo 
como algo que habrá de leerse. El adiestramiento militar hacía hincapié en el 
idioma hablado y en la actualidad, dentro de las escuelas, ese énfasis se ha despla- 
zado nuevamente hacia la lengua hablada, apartándose del terreno de la lectura. 
Así ha ocurrido en parte porque se tienen mejores dispositivos para hacer llegar 
emisiones vocales pronunciadas de modo aceptable a los estudiantes de escuelas 
pequeñas, que podrían carecer de profesores eficientes en el manejo del idioma 
que se enseña. El laboratorio de idiomas se adoptó rápidamente después de 1945 
(Haber, 1963). Es simplemente un conjunto de aparatos que permiten emplear en 
la enseñanza el discurso grabado, en discos o, lo que hoy es más común, en cintas 
magnetofónicas. Los aparatos contemporáneos más elaborados permiten que el 
alurnno imite lo que escucha, que viga después su propia voz, o que el profesor 
controle lo que pronuncia. La consola frente a la cual se sienta el profesor puede 
tener comunicación en doble sentido con varios estudiantes a la vez. 

Ni siquiera los métodos de adiestramiento más perfeccionados son capaces de 
eliminar la ardua labor que los adultos deben realizar para aprender otro idioma. 
En la Escuela de Idiomas del Ejército, en Monterey, California, un estudiante 
pasa comúnmente casi todo su horario durante 8 meses, aprendiendo un idioma 
extranjero, y 12 meses si se trata de una lengua difícil. Aun así, muchos no tienen 
éxito. 

En uno de los primeros estudios acerca del aprendizaje de un idioma en las 
fuerzas armadas, S.B. Williams y Leavit (1947) informaron que el 80% de los 
alumnos que intentaron aprender japonés abandonaron el curso antes de llegar a 
dominarlo. No hay carninos fáciles para llegar al dominio de ninguna tarea de difícil 
aprendizaje. 

Carrol (19635), al reseñar las investigaciones acerca de la enseñanza de un 
idioma extranjero, deja la impresión de que sabemos muy poco acerca de la efecti- 
vidad de los procedimientos que se han adoptado en los laboratorios de idiomas, 
como el hecho de que el estudiante escuche su propio discurso, practique con pa- 
trones particulares del discurso, etcétera. Los trabajos en torno del aprendizaje 
de asociación que podrían ser adecuados para el aprendizaje del vocabulario (véase 
la sección de los dispositivos mnémicos) por lo común no son pertinentes para la 
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forma usual en que se enseña un idioma; es decir, recalcando el uso de palabras 
nuevas en un contexto de discurso significativo. 

Es necesario señalar que se han efectuado varias comparaciones entre los laborato- 
rios de idiomas y los métodos convencionales. En un estudio dirigido por el cuerpo 
docente del Antioch College se comparó la enseñanza convencional de 20 estu- 
diantes de una clase que un instructor regular impartía seis veces par semana, con 
un laboratorio de idiomas en el cual sesenta estudiantes trabajan dos veces por se- 
mana con un instructor regular y cuatro veces con estudiantes auxiliares de labo- 
ratorio (Antioch College, 1960). Los procedimientos experimentales ahorraron 
casi 12 horas semanales del tiempo de Jos instructores regulares. Los periodos del 
kboratorio de una hora 30 minutos cada uno se dividieron entre la presentación de 
los materiales audiovisuales (transparencias y sonido grabado en cintas), el trabajo 
individual en las cabinas del laboratorio de idiomas, y el ejercicio y la práctica me- 
diante el contacto cara a cara con los estudiantes auxiliares. En dos cursos distin- 
tos, las pruebas de aprovechamiento que se aplicaron al final del año mostraron 
significativas diferencias atribuibles a las dos formas de instrucción; como el méto- 
do de laboratorio complacía más a Jos estudiantes y ahorraba tiempo a los instruc- 
tores regulares, hay motivos para recomendarlo. Pickrel, Neidt y Gibson (1958) 
hicieron ver que los profesores que no habían sido capacitados en el uso del espa- 
ñol podían enseñar eficazmente conversación a estudiantes del séptimo grado si 
basaban su instrucción en cintas preparadas por un especialista en español; la 
fluidez oral de Jos niños no era distinta de la que mostraban aquellos a los que ins- 
truyó el profesor de español, Así, los nuevos métodos son prometedores, pero no 
equivalen a una total revolución en la efectividad de la enseñanza. En el estudio que 
acabamos de citar, los grupos instruidos por el profesor de español resultaron superio- 
res en las pruebas escritas a los que aprendieron mediante cintas magnetofónicas. 

En un análisis acerca de las implicaciones del aprendizaje de idiomas extranje- 
ros, Carrol (1962) identificó los siguientes aspectos de la aptitud para tal materia: 
código fonético, sensibilidad gramatical, memoria mecánica para los materiales de 
ese campo y habilidad inductiva para el aprendizaje de idiomas. Debemos notar 
que el conocimiento verbal ordinario (probado can frecuencia en el vocabulario del 
idioma conocido) no es una buena base para predecir la habilidad en el aprendizaje 
de un idioma extranjero, en parte porque en las etapas iniciales no es necesario do- 
minar un vocabulario extenso. En lo que toca a la aplicación de este modelo al 
aprendizaje de un idioma extranjero, Carrol (1962, 19630) cree que el éxito se ob- 
tiene en función de los cinco elementos que se mencionan a continuación, de los 
cuales los tres primeros son cualidades del aprendiz, y los dos últimos, del proce- 
so de instrucción: 


1. aptitud para los idiomas de parte del aprendiz, 

2. inteligencia general. 

3. perseverancia. 

4, calidad de la instrucción. 

3. oportunidad de aprender que se le brinda al estudiante. 


Nuevamente destacamos la importancia de analizar la naturaleza de Ja ejecución, 
tanto para especificar las habilidades componentes requeridas como para diseñar 
un adecuado programa de instrucción. 
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Aprendizaje programado 


El aprendizaje programado comenzó a atraer la atención con la introducción de 
la máquina de enseñanza como auxiliar tecnológico, aunque la esencia de la progra- 

mación no reside en el tipo particular del equipo que se utilice. La primera de estas 
“máquinas fue construida hace muchos años por Sidney L. Pressey, en la universi- 
dad estatal de Ohio (Pressey, 1926, 1927). A pesar de que en su versión original 
se construyó como tina máquina automarcadora para facilitar la realización y califi- 
cación de exámenes objetivos, el aparato muy pronto demostró su habilidad en la 
enseñanza real. El estudiante lee la pregunta que se presenta en la abertura de 
la máquina, selecciona una respuesta entre varias opciones y presiona el botón 
correspondiente a la respuesta elegida. Si es correcta, en la ranura aparece la si- 
guiente pregunta; si es errónea, permanece la pregunta origina!. La máquina 
cuenta los errores del estudiante, pero la cinta no pasa a la pregunta siguiente sino 
hasta después de que se oprima el botón correcto. Como el alumno sabe que su 
respuesta es acertada cuando la pregunta se mueve, obtiene información inme- 
diata (reforzamiento, retroalimentación), y así aprende mientras se prueba a sí 
mismo. Además, como el aparato ha contado sus errores, puede leer su califica- 
ción tan pronto como haya terminado la prueba. La máquina de Pressey no se po- 
pularizó, a pesar de los estudios que él y sus discípulos realizaron para demostrar 
su eficacia como dispositivo de enseñanza. 

La publicación de un artículo de Skinner (1954), cuyos trabajos acerca del condi- 
cionamiento operante ya le habían conferido autoridad en el campo del aprendiza- 
je, imprimió nuevo impulso a la idea de la autoinstrucción automática. El momento 
era adecuado, y el trabajo relacionado con las máquinas de enseñanza y la instruc- 
ción programada floreció poco después. Ahora es una empresa comercial, 
científica y educativa a nivel internacional y a gran escala. La máquina de Skinner 
se diferenciaba de la de Pressey principalmente en que al estudiante no se le 
daban opciones entre las cuales escoger, sino que se le pedía que escribiera su 
propia respuesta en los espacios proporcionados y después, al avanzar la cinta 
impresa, aparecía la respuesta correcta a fin de compararla con la que se había 
escrito. El estudiante '“emitía”” así su propia respuesta, que se “'reforzaba”” con 
la respuesta de comparación, Otra diferencia es que el material se planea de tal 
modo que en esencia no resulta una revisión de lo que ha aprendido parcialmente, 
sino más bien un “programa'” en el cual las respuestas del aprendiz se 
“'moldean”” a medida que aprende. 

El programa se divide en un cierto número de cuadros separados en los cuales 
se presenta una información, y se somete a prueba el recuerdo de otra. En la figu- 
ra 15.8 se ofrecen marcos ilustrativos para la enseñanza del procedimiento del 
condicionamiento clásico. Skinner concibe el texto y la pregunta que aparecen en 
Ja parte superior del cuadro como un *“estímulo'” complejo; el estudiante compone 
y escribe su respuesta en la parte inferior derecha, y entonces se revela la res- 
puesta correcta para proporcionar retroalimentación inmediata. Los cuadros suce- 
sivos en un programa desarrollan y elaboran un concepto, regla o procedimiento, 
El programa a menudo somete a prueba información nueva poco después de que 
se introduce, comprueba un principio dado de varias formas y revisa conceptos y 
principios aprendidos mucho antes. Skinner ponía el acento en el reforzamiento in- 
mediato de las respuestas construidas, una progresión gradual hacia los reperto- 
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Estimulo del cuedro 


El condicionemiento cláelco pares dos estímulos, un estímulo nautre) pere 
ser condicionedo conunestimulo_____ ___ _deunreflejo. 


Incondiclonedo 


retrosllmenteción, confirmación el estudiante responde aqui 


Enel condicionamiento clásico, el estimulo pare ser condicionedo 


en ilempeo el estímulo condicionado. 


Figura 15.8. Ejemplos de dos cuadros en un programa para la enseñanza del condi- 
cionamiento clásico. El estudiante lee la pregunta de la parte superior del cuadro, es- 
cribe una fespuesta, y finalmente mira la respuesta correcta. 


rios complejos, instigadoret ele estímulo de desvanecimiento para las respuestas, 
discriminación de conceptos, y el control de la atención y motivación del aprendiz. 
Con el correr de los años se han desarrollado dispositivos de enseñanza más com- 
plejos que los de Pressey y Skinner. Lumsdaine (1959) describe algunos; por 
ejemplo, en un arreglo se empleaba una proyección fílmica paso por paso para en- 
señarle a un técnico la operación de una pieza de equipo electrónico. En la pantalla 
aparece un solo segmento de demostración hasta que el aprendiz lo domina. Éste 
presiona entonces el botón para pasar a la ilustración siguiente, y así sucesivamen- 
te, hasta que aprenda la operación en su totalidad. Las computadoras electrónicas 
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modernas han entrado en escena, a veces para combinar la proyección de trans- 
parencias, de películas y de otros materiales dentro del programa para un 
solo aprendiz, y ocasionalmente con el propósito de que un grupo de aprendices 
maneje su propio aprendizaje. Tal flexibilidad permite casi cualquier arreglo que el 
investigador desee, siempre que resulte costeable. 

La esencia del aprendizaje por medio de una máquina de enseñanza no reside en 
el aparato sino en el material que se presenta, y se ha descubierto que los libros 
programados, de diseño adecuado, cumplen el mismo cometido que las formas 
más simples de las máquinas de enseñanza. Los mecanismos más sencillos en oca- 
siones se destacan corao “vuelve páginas mecánicos'”, puesto que son capaces de 
poco más de lo que el estudiante puede hacer por sí solo. Es obvio que las máqui- 
nas complicadas logran mucho más que esto, pero la molestia que implica el meca- 
nismo más sencillo remarca la importancia del programa sobre la tecnología. El 
libro programado no debe confundirse con el antiguo **cuaderno de trabajo'* que 
se emplea en la educación común; el cuaderno era ante todo un medio para practi- 
car con ejemplos lo que el profesor o el texto habían enseñado, mientras que aquí 
el programa se diseña para que lleve a cabo la enseñanza por sí solo. Par lo tanto, 
debe partir de lo que el aprendiz ya sabe, y a esto se le agrega material nuevo, 
proporcionando respuestas a las que primero se hace alusión, o se instiga, con el 
objeto de hacer altamente probables las respuestas correctas. Una vez que se han 
“reforzado”, estas respuestas se sobreaprenden a través de su uso repetido, a 
medida que el material nuevo se inserta dentro del que ya se ha aprendido. Es evi- 
dente que la persona que elabora un programa debe ser consciente de la o7ganiza- 
ción del conocimiento, de su estructura lógica y psicológica, para construir de esa 
manera el conocimiento y la comprensión. El programador se esfuerza en prever 
lo que sucederá, aunque en la práctica tenga que corregir los programas a través 
de numerosos ensayos, hasta que sus aprendices los dominen con un mínimo de 
errores, por lo general en una corrida de todo el programa, El resultado del apren- 
dizaje se comprueba mediante un examen de tipo convencional, que verifica si el ma- 
terial en verdad se ha dominado y puede aplicarse con rigor en contextos nuevos. 

Skinner (1958) señaló la similitud entre la instrucción programada y la enseñan- 
za individual de la siguiente forma: 


1. un buen tutor comienza en donde el alumno se encuentra, y no insiste en llevarlo 
más allá de lo que éste puede comprender. 

2. un buen tutor se mueve a una velocidad congruente con la habilidad del alumno para 
aprender. 

3. un buen tutor no permite que las respuestas falsas queden sin corrección, 

4. un buen tutor no dicta; en vez de ello, mediante sus indicaciones y sus preguntas, 
ayuda al alumno a encontrar y a enunciar respuestas por sí solo. 


Según Skinner, estas cualidades se encuentran en un buen prograraa. 


Variedades de programación 

El tipo de programa por el que aboga Skinner, el que se mueve paso a paso a 
través de un conjunto único de materiales, se conoce como programación lineal. 
Otro tipo, asociado generalmente con el nombre de Norman Crowder, se denormi- 
na programa ramificado. En los libros programados que emplean este método (por 
ejemplo, Crowder y Martin, 1961), se proporcionan respuestas de opción múlti- 
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ple, y aquella que el estudiante selecciona lo dirige hacia una página distinta del 
libro. El texto es entonces un libro **revuelto”? que se lee de modo muy irregular. 
La respuesta correcta remite a una página en la cual se presenta la siguiente por- 
ción de mformación, con alternativas nuevas. Se señala la respuesta incorrecta, 
con algunos comentarios acerca de por qué pudo haber sido seleccionada, y se 
hace regresar al aprendiz para que haga otra elección. 

Crowder cree que debería existir un medio para que los estudiantes mal prepa- 
rados retornaran a los materiales más simples, y que los mejor preparados 
deberían pasar por alto parte del material; por lo tanto, sus progresos posterko- 
res consideran estos caminos opcionales a lo largo del material. Los progra- 
mas lineales del tipo más moderno incluyen también algún tipo de revisión para 
quienes deseen regresar a las partes iniciales del programa, y una oportunidad de 
saltear el material a aquellos que están listos para seguir adelante. Los programas 
basados en computadoras proporcionan el máximo de flexibilidad en estos aspec- 
tos, incluyendo sendas alternativas y distmtos ejemplos para los aprendices que 
los necesiten. Así, la programación ya no constituye una línea aislada de desarro- 
llo, ni la máquina de enseñanza es un tipo único de equipo. 

Se han realizado muchas investigaciones para confortar la instrucción mediante 
programas con los métodos de enseñanza tradicional. Esas comparaciones de- 
muestran que el aprendizaje programado es tan eficaz y en ocasiones mejor que 
los métodos tradicionales. Los estudios emprendidos para comparar diferentes 
variaciones dentro de la programación no han ofrecido mucha información, ya que 
los estudiantes parecen aprender independienternente de lo que el programa les 
exija hacer. De este modo, los resultados en el examen final son casi los mismos, 
ya sea que el programa de aprendizaje requiera que el estudiante construya su res- 
puesta o que seleccione o reconozca una respuesta correcta; ya sea si el estudian 
te responde o si tan sólo estudia la respuesta correcta a Jas preguntas; o bien si la 
retroalimentación se da de imnediato o después de una demora, o si los programas 
siguen un orden lineal o ramificado en los errores, etcétera, (McKeachie, 1974.) 
Se cree que los experimentos con resultados nulos se deben al escaso poder del 
diseño estadístico y a la naturaleza relativamente poco elaborada y no analítica 
del criterio del “examen final”. Así, los estudiantes pueden compensar un mal 
programa al estudiar por su cuenta para obtener una buena calificación. 

Es posible que el principal reproche contra los libros de texto programados, o 
los programas para máquinas, sea que en última instancia se mueven con mucha 
lentitud, son repetitivamente tediosos y aburridos para los estudiantes brillantes. 
Además, aquellos a los que sólo se les enseña con el programa, sienten una nece- 
sidad real de contacto con un profesor que responda preguntas, 'ayude a esclarecer 
las metas del curso o su organización, etcétera. Es muy probable que el contacto 
con el profesor proporcione también una gran parte de los incentivos sociales para 
motivar y mantener la interacción continua del estudiante con la máquina. Las má- 
quinas funcionan mejor cuando se les agrega un tutor como motivador. 


Instrucción con'ayuda de computadoras (J4C) 
Hoy en día la instrucción con ayuda de computadoras (JAC) tiene tantas dimen- 


siones que ya no se le considera como una simple derivación de la máquina de en- 
señanza o del tipo de aprendizaje programado que introdujo Skinner. Sin duda, la 
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máquina de enseñanza y los programas lineales o ramificados son sus antecesores 
inmediatos, pero la instrucción computarizada ha evolucionado con rapidez. 

Una gran ventaja de la computadora en comparación con otros tipos de 
tecnología educativa es que puede realizar una presentación muy flexible de los 
materiales al aprendiz, y seguir con atención el progreso de varios estudiantes al 
mismo tiempo. Una “lectura” de la computadora puede demostrar en qué punto 
se encuentran todos los aprendices en un momento dado, y cuál ha sido su progre- 
so desde algún punto anterior de referencia. 

Han aparecido varias modalidades de instrucción con ayuda de computadoras 
(Atkinson y Wilson, 1969). La primera es el procedimiento de enseñanza de ejerci- 
cio y práctica, como una prolongación del aprendizaje programado; indudablemen- 
te, ésta es la modalidad dominante y la que se emplea en los sistemas desarrolla- 
dos por Atkinson y por Suppes. en Stanford. Por supuesto, lus profesores usan 
comúnmente esa modalidad sin la computadora, El sofisticado aparato tiene la 
ventaja de individualizar las actividades y de introducir una mayor eficiencia en el 
aprendizaje. Un método un tanto distinto se ha aplicado en la enseñanza de 
estadística en la Universidad de California, en Los Ángeles. El estudiante aprende 
un lenguaje de computadora por medio del cual puede manipular grandes confun- 
tos de datos, y por tanto, al terminar el curso es capaz de manejarlos. Otra aplica- 
ción se vincula con los juegos que simulan problemas reales, en los que se toman 
decisiones y se estudian sus consecuencias en relación con problemas propios de 
la ciudad o sistemas de control político. Uno de esos sistemas, desarrollado por la 
Board of Cooperative Educational Services en el condado de Westchester, Nueva 
York, trata con problemas económicos mediante lo que se conoce como el juego 
sumerio, El estudiante dirige un imperio mítico y asigna material humano y otros 
recursos y la computadora estima las consecuencias interactivas de sus decisio- 
nes. Incluso pueden realizarse experimentos de laboratorio de química sin que el 
estudiante maneje el equipo y las sustancias (Bunderson, 1967). La flexibilidad de 
la computadora es enorme; por lo tanto, cualquier prejuicio acerca de las limitacio- 
nes inherentes a la instrucción realizada con su ayuda será probablemente falso, 

El desarrollo de la ZAC en la Universidad de Stanford proporciona una historia 
representativa de la evolución de la tecnología y de la aceptación de este tipo de 
instrucción. A partir de 1963 se desarrolló un pequeño sistema y más tarde, cuan- 
do se obtuvieron fondos gracias a la ley de educación elemental y secundaria de 
1965, se emprendió un programa a gran escala. La /BM y el grupo Stanford desa- 
rrollaron conjuntamente un sistema que hacía uso de la ¿BM 1500, que entró en 
operaciones en 1966, Desde los modestos comienzos del ejercicio con computa- 
dora para cuarenta y un niños del cuarto grado en 1965, el sistema creció hasta 
que en 1968 alrededor de 3 000 estudiantes recibían lecciones diarias en cursos 
iniciales de lectura, aritmética, ortografía, lógica y ruso elemental en siete escue- 
las cercanas y en localidades tan alejadas de California como McComb, Mississippi; 
y Morehead, Kentucky. Toda la instrucción se controlaba mediante una computa- 
dora central ubicada en Stanford. De forma ampliada, el sistema todavía se en- 
cuentra en operación y lo dirige una compañía comercial de instrucción con 
computadoras. 

La versión original del sistema de enseñanza 1 para la instrucción de la lec- 
tura tenía una estación o terminal compleja en la cual trabajaba el estudiante, y 
consistía en una pantalla en la que se proyectaban imágenes de cuadros de acceso 
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aleatorio bajo control de la computadora; un tubo de rayos catódicos donde se pre- 
sentaba el material; una pluma luminosa mediante la cual podian darse y registrar- 
se en dicho tubo las respuestas de sondeo táctil; un tablero de máquina de escribir, 
unos audífonos y un micrófono (véase la figura 15,9). Este dispositivo, de un tipo 
que revela el virtuosismo de la tecnología de la instrucción, cumplía su propósito al 
mostrar lo que podía hacerse; sin embargo, como a menudo sucede con los pro- 
ductos nuevos, paulatinamente se ha simplificado sin perder su efectividad (véase 
la figura 15.10). (Atkinson y Fletcher, 1972.) 

Los problemas motivacionales con la computadora resultaron distintos de lo que 
se esperaba. En lugar de sentirse disminuido por las formidables cualidades mecá- 
nicas del aparato, el estudiante se aficiona a la computadora, ya que ésta le res- 
ponde. Por lo tanto, una forma de motivación podría ser negarle al estudiante la 
oportunidad de usar el aparato, lo que interpreta como privación o castigo (Hess y 
Tenezakis, 1970). El acceso a las lecciones por computadora se emplea entonces 
para recompensar otros ejercicios educativos. 

Esos sistemas de enseñanza han demostrado ser efectivos; los estudiantes 
aprenden muy bien con ellos, y los sistemas pueden realizar muchas de las leocio- 
nes de ejercicio y práctica; por consiguiente, permiten a los profesores disponer 
de tiempo libre para dedicarlo a la instrucción más compleja. Los niños avanzan en 
el programa de instrucción a su propio ritmo, pero el volumen del aprendizaje se 
controla, en gran parte, por el tiempo que pasan trabajando con la computadora. 


Figura 15.9. Terminal del estudiante usada para la instrucción tutorial en lectura ini- 
cial (cortesia de R C Atkinson) 
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Figura 15.10. Terminal simplificada usada más tarde para la instrucción en lectura 
inicial (cortesía de R. €. Atkinson). 


Un problema persistente es el de los costos. La conveniencia económica depen- 
de del suficiente uso de la computadora, de manera que se reduzca el costo por 
hora por estudiante. Se ha calculado que para un solo sistema que sirva a 500 ter- 
minales (lo necesario para una pequeña escuela primaria, una secundaria y una de 
bachillerato superior que se encuentre muy cerca), el costo podría mantenerse en 
0.11 dólares por hora estudiante, alrededor de lo que hoy se gasta en la instrucción 
impartida de la manera tradicional en las escuelas rurales (Kopstein y Seidel, 1969). 
Sin embargo, la mayor parte de los distritos escolares consideran que la ZAC es un 
lujo extravagante que no pueden permitirse en épocas de austeridad. Cuando de- 
ben recortarse los presupuestos, los equipos nuevos son los que primero se des- 
cartan: es preferible deshacerse de una máquina que de un profesor que necesita 
el empleo. Otro obstáculo para su adopción reside en que no hay programas JAC 
lo bastante diversos disponibles en el comercio, es decir, programas específicos 
de estudio, que varían en los distintos distritos escolares. 


TAC inteligente 


Las personas que trabajan en el campo de la inteligencia artificial (véase el 
capítulo 12) objetan que la ZAC estándar hace muy poco uso del poder real de la 
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computadora, la cual funciona en estas aplicaciones como un ““costoso vuelve pá- 
ginas””, muy alejado de las cualidades de un verdadero tutor. Así, sería muy con- 
veniente que el estudiante empleara un libro de texto programado. Por ejemplo, el 
estudiante no puede formular preguntas a la computadora o hacer que esclarezca 
conceptos confusos. El programador debe anticipar todos los enigmas y preguntas 
posibles e intentar responderlos en su programa (una tarea imposible). La división 
del “conocimiento'* en cuadros pequeños parece ad hoc. Aunque el programa 
ZAC estándar puede decirle a un estudiante que su respuesta es errónea y propor- 
cionarle la correcta, no está en condiciones de formular hipótesis con base en el 
historial de errores de un estudiante para averiguar dónde se encuentran sus 
equivocaciones o dificultades reales. En los programas JAC actuales, la represen- 
tación por computadora del conocimiento de un estudiante es sencillamente el nú- 
mero del cuadro (o número de lección) en el ramal de habilidades en que está tra- 
bajando, como si el conocimiento que tiene una persona acerca de la física fuera 
tan sólo e) conjunto de problemas que fue capaz de resolver correctamente hasta 
el momento. Con su programa SCHOLAR, Carbonell (1970) y sus colaboradores 
propusieron la introducción de cualidades de índole más humana en los sistemas 
ZAC. Dicho programa es un sistema en miniatura para la enseñanza de la geografía 
de América del Sur. La meta básica consiste en hacer que un tutor de tipo socráti- 
co, basado en la computadora, aplique sus conocimientos de geografía para elabo- 
rar preguntas de diagnóstico que se le formulan al estudiante; el tutor puede 
comprender y evaluar las respuestas complejas (mecanografiadas) que da un estu- 
diante, diagnosticar qué partes del conocimiento del alumno son defectuosas y ne- 
cesitan nuevo aprendizaje, y responder con inteligencia a cualquier pregunta ines- 
perada que el alumno formule. Sin duda, se trata de objetivos muy avanzados que 
SCHOLAR y sus sucesores sólo han alcanzado parcialmente; sin embargo, sirven 
de metas futuras. 

Los componentes de un sistema JAC inteligente son su dominio de experiencia 
acerca del conocimiento que debe impartir; un modeto del estudiante, que indica lo 
que el alumno sabe y desconoce en cualquier momento; y un conjunto de estrate- 
gias de instrucción, que especifica la forma en que ha de presentarse la informa- 
ción para que el estudiante la aprenda. Además, el sistema debe tener ia capacidad 
de comprender preguntas en lenguaje natural y de generar respuestas en un idio- 
ma razonable. Ningún sistema ha perfeccionado todos estos componentes; más 
bien, un investigador dado se concentra en el desarrollo de sólo uno o dos compo- 
nentes de un sistema más amplio, por ejemplo, la parte correspondiente a la con- 
testación de preguntas. 

El programa SCHOLA usaba un sistema para comprender el lenguaje, relati- 
vamente primitivo basado en la gramática de caso, una red semántica para repre- 
sentar su conocimiento de geografía, y un conjunto de reglas de intersección y de 
búsqueda para inferir respuestas a las preguntas. Una novedosa característica 
de la representación de conocimiento del SCHOLAR eran los rótulos de importan- 
cia que se vinculaban con cada hecho e indicaban qué nivel de detalle se alcanzaba 
acerca de algún tema. Los rótulos de importancia se usaban heurísticamente para 
responder preguntas, en especial para enfocar el nivel de detalle dado que el estu- 
diante deseaba discutir. Si se le preguntaba: “digame algo acerca del Perú”, 
el SCHOLAR sólo contaría los hechos más importantes. Los diseñadores del 
SCHOLAR (Collins et al, 1975) observaron un cierto número de hechos intere- 
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santes en torno de la contestación de preguntas, Una distinción novedosa se rela- 
cionaba con el hecho de si la pregunta se refería a un “conjunto cerrado” de una 
pequeña lista de objetos (por ejemplo, países en América del Sur), o aun “*conjun- 
to abierto””, en el cual sólo los miembros más importantes de un conjunto indefini- 
damente grande se almacenan de modo explícito en la base de conocimientos (por 
ejemplo, los productos alimenticios que se cultivan en el Perú). La naturaleza del 
conjunto se identifica en la base de conocimientos y se emplea para responder pre- 
guntas, 

Considérese ahora la manera en que el SCHOLAR utiliza los rótulos abiertos y 
cerrados en una categoría. Si se le pregunta: Es *'¿Dinamarca un país de América 
del Sur?” y no sabe nada acerca de Dinamarca, buscará en su conjunto cerrado de 
países sudamericanos y, al no encontrar a Dinamarca, contestará: ““definitivamen- 
te no””. Si se le pregunta si el hule es un producto de Guyana (un dato que no está 
almacenado explícitamente), razona una respuesta plausible usando el hecho de 
que los productos de un país son un conjunto abierto. En este caso, el SCHOLAR 
notaría primero que otros países productores de hule lo enumeran como un hecho 
importante y, como no tiene al hule entre los productos importantes de Guyana, 
extrae esta conclusión: “probablemente no; de otro modo, yo conocería ese 
dato importante”. 

Este método heurístico y muchos otros que se programan en el SCHOLAR 
para un razonamiento correcto son fascinantes y de tipo humano, y lo convierten 
en una simulación interesante de la habilidad humana de responder preguntas. Sin 
embargo, aunque el SCHOLAR constituía una teoría importante de la contesta- 
ción humana de preguntas, nunca llegó a la etapa avanzada necesaria para que en 
verdad enseñara geografía a los estudiantes. 

Ultimamente se han logrado considerables avances en el diseño de sistemas 
TAC inteligentes, pero aquí sólo los mencionaremos (para algunas reseñas, véase 
J. S. Brown y Goldstein, 1977). El sistema WHY de Collins (1976) y de Stevens y 
Collins (1977) proporciona a los estudiantes nociones referidas a sistemas que 
tienen relaciones causales entre conceptos, los cuales a menudo originan ideas 
erróneas acerca de por qué los procesos se desarrollan de determinada forma. El 
WHY intenta ayudar al alumno a descubrir los procesos causales correctos al con- 
siderar una gama de casos simples que tal vez ya conozca. Por ejemplo, al enseñar 
las causas de la lluvia, el WHY hace que el estudiante conjeture en primer lugar 
una regla causal, a continuación escoge contraejemplos para obligar a revisiones 
sucesivas de la regla, y procede de una manera socrática de acuerdo con diversas 
“reglas de instrucción”? para ayudarle a formular una regla causal de suficiente ge- 
neralidad. Las reglas de instrucción del WHY y la manera en que persigue metas 
globales de enseñanz4 constituyen estrategias muy convenientes para cualquier 
profesor. 

Otro programa ZAC inteligente es el SOPHIE, desarrollado por J. S. Brown y 
Burton (1975), que enseña a los ingenieros habilidades en la solución del proble- 
ma. Este programa se concentra en la detección de desperfectos en una pieza de 
equipo electrónico deficiente con un diagrama de circuito conocido. A partir del 
voltaje o de las mediciones de corriente del circuito, los estudiantes conjeturan 
“averías”, y el programa SOPHTE los instruye acerca de formas razonables para 
construir y evaluar hipótesis sucesivas. 

Otro ejemplo de un programa de detección de averías en la enseñanza es el 
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BUGGY, también desarrollado por J.S. Brown y Burton (1978), que ayuda a los 
profesores a diagnosticar las causas profundas de los errores de un estudiante en 
la realización de problemas aritméticos. El BUGGY se originó en la creencia de 
que muchos de sus yerros no son aleatorios sino sistemáticos, y de que surgen 
de alguna concepción errónea básica (algún bug) acerca de la manera de ejecutar 
una operación matemática. El profesor efectivo debe ser capaz de diagnosticar el 
error de procedimiento y prescribir un remedio exacto. El programa BUGGY 
toma una tarea, como sumar números de tres dígitos, la representa en una red de 
subprocedimientos (por ejemplo, sumar números sólo en la misma cohumna cada 
vez), y proporciona ejemplos de los errores de adición que ocurrirán si uno o más 
subprocedimientos son defectuosos. Cuando actúa como instructor, el BUGGY 
escoge un error de procedimiento en que los estudiantes incurren con frecuencia, 
y produce una muestra de errores de adición con este defecto. Un profesor exa- 
mina estos ejemplos y localiza la falla, como en el sistema SOPHTE; el programa 
BUGCY produce entonces otros ejemplos para que el profesor verifique su hipó- 
tesis acerca del error, comparándola con éstos. El procedimiento instruye a los 
profesores en el diagnóstico. El BUGGY también puede inferir defectos en el 
patrón de los errores de un estudiante arrojando un bug (error) dentro de alguna 
subbabilidad de su red perceptual (por ejemplo, al pasar un número de la suma de 
la primera a la tercera columna), calcular las respuestas de los problemas de los 
estudiantes a fin de comprobar si concuerdan los tipos de errores y su patrón, y 
continuar ensayando btegs hasta que se encuentre una igualación cercana, En una 
prueba de sustracción que se le dio a 1325 alurmos de 40., 50. y 60. grado el BUGGY 
logró encontrar uno u otro bx? consistente en su red de procedimiento (para la ta- 
rea de sustracción) que explicaría los patrones de error del 40% de los estudian- 
tes; los demás probablemente incurrían en errores de descuido aleatorio o erro- 
res de bug múltiple. Esta información de diagnóstico es útil en la instrucción de un 
estudiante específico, y la frecuencia de los tipos de bugs en una población de estu- 
diantes sugiere áreas de dificultad en las cuales deben concentrarse los esfuerzos 
del profesor. 

Es evidente que estos programas inteligentes de instrucción se encuentran en 
una etapa embrionaria. En la actualidad se exploran varios dominios de destreza y 
se indican muchas estrategias de instrucción. Se le presta atención a los detalles 
de la representación de conocimientos (del experto) y a la contestación plausible 
de preguntas del tutor. Los sistemas que existen actualmente son prototipos bur- 
dos, que deben perfeccionarse antes de que puedan aplicarse con eficiencia. Sin 
embargo, el pensamiento que interviene en los tutores inteligentes conduce a al- 
gunas de las recomendaciones o heurísticas más avanzadas de que disponen los 
profesores en la práctica. Así, los beneficios reales de la investigación tal vez no 
residan tanto en los programas de funcionamiento práctico, sino en las heurísticas 
de instrucción que pueden enseñarse a los instructores humanos. 


Sistemas de instrucción personalizada (Plan Keller) 


En un artículo muy importante (1968), el psicólogo Fred Keller presentó un rmé- 
todo de instrucción de un curso diseñado para eliminar la instrucción por medio de 
conferencias y programación rígida, que permite al e. :udiante progresar a su pro- 
pio ritmo y demostrar su comprensión de los materiales. En su forma original, el 
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programa se desarrolló para cursos de introducción a la psicología a nivel universi- 
tario, pero en la actualidad se aplica a cualquier curso universitario o de bachillera- 
to superior. Después de muchos años como profesor umversitario, Keller se con- 
venció (al igual que tantos otros) de que la disertación constituía un medio muy 
pobre para impartir información a los estudiantes; creía que si las conferencias 
tenían alguna justificación era la de motivar para el aprendizaje de conductas que 
los estudiantes ejecutarían fuera de la clase. 

Para sustituir la enseñanza mediante disertaciones, Keller sugería que el profe- 
sor preparara un gran número de unidades de aprendizaje para las materias de su 
curso, Cada unidad de aprendizaje debería asociarse con la lectura de algún texto; 
las “notas de conferencia”” del profesor o las discusiones de las lecturas desta- 
carían los puntos de interés y remarcarían de modo enfático aquellos que debían 
aprenderse. La preparación de tales unidades requiere que los profesores sean 
muy claros acerca de qué quieren exactamente que sus alumnos aprendan; deben 
decidir cómo dividir un tema en múltiples unidades pequeñas e independientes, 
cómo presentarlas y cómo evaluar la comprensión de los estudiantes. Las unida- 
des características implican un tema central (por ejemplo, “impulsos biológicos*”) 
y a menudo coinciden con un capítulo o una sección de capítulo de un texto de 
introducción al tema. Un curso típico podría dividirse en alrededor de 20 unidades 
de aprendizaje. 

Después de preparar las notas para cada unidad, el profesor permite al estudian- 
te trabajar a su propio ritmo, a partir de la unidad ínicial. Los estudiantes deben 
hacer un breve examen acerca de los puntos esenciales de una unidad, y aprobarlo 
con un alto nivel de aprovechamiento (por lo común el 90% o más) a fin de que se 
les permita pasar a la siguiente umdad. Si no cumplen con este criterio en un exa- 
men, un tutor o el profesor repasa con ellos el material ausente; los estudiantes 
revisan la unidad nuevamente y regresan para hacer una prueba distinta acerca de 
esa unidad. Estas pruebas pueden aplicarse en cualquier momento que el estu- 
diante sienta que está preparado, y los aprovechamientos inferiores al criterio no 
se incluyen en sus calificaciones. El tutor sólo registra aquellas pruebas de unidad 
que cada estudiante ha aprobado, y las calificaciones se determinan por el número 
de unidades cubiertas durante un semestre o trimestre académico. Pueden impar- 
tirse conferencias, pero la asistencia es opcional; el objetivo de las disertaciones 
es incrementar el interés con demostraciones vivas, entrevistas y películas alusi- 
vas a las unidades del curso. 

Este método de instrucción se conoce como sistema de instrucción personaliza- 
da o SIP. Desde la perspectiva del estudiante, el SIP es personalizado en el senti- 
do de que e! alumío avanza a su propio ritmo, en gran parte estudia y aprende por 
su cuenta, se someté a muchos exámenes y recibe retroalimentación acerca del 
progreso de su aprendizaje, y discute los puntos del temario con un tutor, En 
comparación con las clases tradicionales de disertación con exámenes a mitad y al 
final del curso, los estudiantes del SP siempre conocen con exactitud a qué altura 
se encuentran en la consecución de los objetivos del curso y qué deben hacer para 
lograr una u otra calificación. Pueden trabajar con rapidez o lentitud, dependiendo 
de las presiones de otros cursos o labores (algunos estudiantes trabajan con tanta 
rapidez que terminan todas las unidades requeridas a la mitad de un trimestre aca- 
démico). Pero los profesores SIP mo se desalientan por tales sucesos. Como han 
decidido los temas que deben conocerse para aprobar el curso, creen que ese co- 
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nocimiento se ha evaluado con exactitud; además, la evidencia sugiere que la cali- 
dad y retención de la información es en gran parte independiente de la rapidez con 
que se adquiera. 

Desde la aparición del S/P, en muchos estudios se ha comparado el aprendizaje de 
los alumnos sujetos a este régimen con el aprendizaje en cursos convencionales 
de disertación con materiales equivalentes. Estas comparaciones resultaron 
extraordinariamente favorables al SIP: los estudiantes aprenden igual o más 
expresan su agrado por el tema de estudio y el sistema, y se muestran dispuestos 
a tomar más cursos SIP y a solicitar sus beneficios. Una vez que los profesores 
escépticos se imbieron convencido de las ventajas de este sistema, departamen- 
tos completos —e incluso universidades enteras— han adoptado el método. Este 
ha demostrado su efectividad en la enseñanza de diversos tipos de cursos; en un 
artículo de Kulik, Kulik y Carmichael (1974) se reseña el éxito del sistema en la 
enseñanza de una multiplicidad de materias universitarias. 

Como sucede con muchos métodos de enseñanza, se han propuesto algunas va- 
riaciones, y constantemente se experimenta con el formato y las reglas de Opera- 
ción del curso. En el Jourxal of Personalized Instruction se informa acerca de 
muchas de estas variaciones, con evaluaciones comparativas de los alumnos. Una 
modalidad efectiva es el uso de tutores estudiantiles —a menudo estudiantes 
graduados—, que instruyen a sus compañeros que toman un curso de este tipo 
por primera vez. Los tutores aprenden bastante (como se manifiesta en su avan- 
zado trabajo en el campo) al preparar exámenes orales para sus alumnos o al ins- 
truir a quienes requieren ayuda. En los cursos SP, la definición de una unidad es 
flexible y puede incluir una práctica de campo, la dirección de un experimento, un 
examen relacionado con el contenido de varias disertaciones, etcétera. El criterio de 
aprovechamiento para el dominio de una unidad, que permite al estudiante pasar a 
otra, varía del 70 al 100% y arroja los resultados esperados: un requisito de alto apro- 
vechamiento para avanzar a la siguiente unidad hace que los estudiantes, en promedio, 
aprendan más acerca de menos unidades en un tiempo fijo. La característica atrac- 
tiva del sistema SIP es que permite un gran ajuste individual de las unidades y las 
asignaciones del curso de acuerdo con la concepción del profesor acerca de la im- 
portancia relativa de cada tema que ha de enseñarse. 

La adopción general del método SIP exige un gran esfuerzo por parte del ins- 
tructor, sobre todo cuando debe establecerlo por primera vez, lo que constituye 
un obstáculo. Antes de implantar el curso, deben prepararse muchas notas del 
contenido de cada unidad auxiliares de enseñanza, manuales de estudio, y exámenes al- 
ternativos. Y muchos profesores desean evitar este trabajo inicial. Adernás, el de- 
sarrollo del curso requiere de atención constante, de la ayuda de tutores, de 
reuniones regulares con tutores y estudiantes lentos, y de organizar demostra- 
ciones interesantes en clase. Si un instructor debe impartir un curso dado sólo 
unas cuantas veces, quizá piense que este esfuerzo inicial no será recompensado 
por la reducción del trabajo en los años subsiguientes. 

Un segundo obstáculo es que muchos estudiantes, profesores y administrado- 
res creen que una clase debe incluir disertaciones en vivo, y cualquier intento de 
eliminarlas puede considerarse como negligencia o pereza de parte del profesor. 
Las virtudes de la disertación se ensalzan a menudo en términos de que motiva a 
los estudiantes, responde a sus preguntas, estimula el pensamiento y la creativi- 
dad espontánea (sin mencionar el sentido del humor). Estas creencias tradiciona- 
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les persisten y hacen a un lado al SIP a pesar de la evidencia de que, en términos 
generales, la disertación en vivo no es un huen medio de instrucción. Obviamente, 
se escoge por otras razones y no porque imparta una gran cantidad de conocimien: 
tos sobre el terreno. 

Acaso el problema más dificil para los programas SIP es que chocan con las con- 
cepciones tradicionales de la programación y calificación del curso, las cuales de- 
terminan el funcionamiento cotidiano de los administradores y de los estudiantes 
universitarios (o del bachillerato superior). Por lo general, un “*salón de curso”” (al 
igual que un laboratorio de idiomas) se establece aparte, y cualquier estudiante 
pueda acudir a él para estudiar una lección dada (por ejemplo, asistir a una de- 
mostración con transparencias y cintas magnetofónicas), o presentar el examen 
de una unidad. Pero aparte de eso, el criterio en lo que se refiere del sistema al 
dominio de cada unidad, a las múltiples pruebas sin castigo, a permitir que los es- 
tudiantes sigan adelante hasta que aprueben tantas unidades como deseen; todo 
esto hace estragos en las prácticas tradicionales de calificación. La forma más co- 
mún de dirigir un curso universitario SIP —en el cual las calificaciones se determi- 
nan por el número de unidades que el interesado concluya en un semestre o t- 
mestre— motiva tanto a los estudiantes que un elevado porcentaje obtiene MB, y 
la mayoría de los restantes B, Y estas calificaciones no se consiguen fácilmente. 
Los estudiantes reconocen que en un curso SIP trabajan más y durante mayor 
tiempo que en un curso convencional hasado en disertaciones, y aseguran que 
aprenden mucho más. Pero los funcionarios administrativos de las universidades 
se molestan a causa de algunos cursos de introducción, en los cuales la mayoría de 
los estudiantes recibe una A. 

La álosofía SIP implica una nueva orientación de la educación, el aprovecha- 
miento y las calificaciones. Antiguamente se crefa que las calificaciones informaban 
del porcentaje de los objetivos del curso que un estudiante lograba; pero en el 
aprendizaje de dominio los estudiantes aprenden todos los objetivos importantes 
que el instructor ha especificado: si no lo hacen, no pueden pasar a la siguiente 
unidad. Como sabemos, las calificaciones también se usan para comparar y orde- 
nar por rango a los estudiantes, y es esta función comparativa la que se pierde 
cuando aprenden con cursos SIP, Las calificaciones se emplean para investigar, 
seleccionar y escoger a las personas que recibirán ofertas de trabajo, que serán 
admitidas en las escuelas profesionales, que recibicán becas, etcétera. Las empre- 
sas o las escuelas profesionales quieren a los estudiantes “más brillantes'*, y 
analizan las calificaciones del curso para realizar esa selección. Acaso sea el mo- 
mento de que las escuelas reconsideren su verdadera misión, en lugar de cumplir 
a ciegas con el papel evaluador que la sociedad les ha confiado. Esa misión consis- 
te en enseñar, informar, satisfacer la curiosidad, facilitar el descubrimiento, fo- 
mentar el desarrollo de individuos competentes, promover el conocimiento, el dis- 
cernimiento analítico y, tal vez, la sabiduría. 


PROBLEMAS EN LAS APLICACIONES 


Se han reseñado, a grandes rasgos, varios de los instrumentos de enseñanza y 
de los nuevos métodos de instrucción desarrollados por los psicólogos del aprendi- 
zaje. Es obvio que cada nuevo dispositivo, romo juego de simulación de enseñan- 
za, requiere de la investigación para perfeccionarse, comprobar su efectividad, va- 
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riar y delimitar su utilidad. El proceso exige la cooperación de *'ingenieros con- 
ductuales aplicados”, así como psicólogos académicos e instructores o profesores 
especializados. Queda mucho trabajo por hacer y gran parte es de ingeniería. Por 
ejemplo, cuando alguna idea tendiente a mejorar la instrucción en aritmética se en- 
saya con éxito en el laboratorio, entonces deberá incorporarse a un curriculum ex- 
perimental con profesores locales dispuestos. Una vez que pasa la prueba, el 
curriculum puede enviarse a escuelas más distantes y a profesores menos dis- 
puestos, que seguramente no seguirán los mismos procedimientos al administrar 
el sistema. Sin embargo, si el material continúa teniendo éxito, la fase siguiente 
consiste en transformarlo en un “*paquete*” para un uso más amplio, defender o 
promover su adopción en las juntas escolares locales o estatales, preparar ma- 
nuales, entrenar profesores para que empleen apropiadamente los materiales o las 
lecciones, etcétera. Desde luego, muchos investigadores del aprendizaje no están 
dotados del talento, el temperamento o carecen de los objetivos necesarios como 
para trabajar en muchas de estas fases. Por lo tanto, es muy probable que remitan 
sus escasas ideas acerca de métodos o materiales educativos a un centro de desa- 
rrollo educativo o curricular, Es evidente que el conjunto de actividades necesa- 
rías para hacer que se adopte una directriz acerca de un curriculum es labor de un 
especialista; en consecuencia, gran parte de las recientes erogaciones educativas 
del gobierno de los Estados Unidos se han dedicado a grandes centros de investi- 
gación que desarrollan curriculum experimentales y los comprueban en condicio- 
nes del campo. 


El problema de la innovación educativa 


En una organización tan compleja como un sistema escolar, los métodos nuevos 
a menudo encuentran obstáculos. Si no se cuida de introducir los materiales o mé- 
todos novedosos ante todos los interesados, se corre el riesgo de que lo mejor del 
equipo permanezca ocioso, que se desaprovechen los mejores recursos e incluso 
que se sabotee la mejor técnica. Una vez que los principios de la ciencia básica se 
han establecido y sus aplicaciones se han validado en la práctica de los salones de 
clases, de ningún modo se garantiza su adopción en gran escala y, si ésta se fuer- 
za, no hay seguridad alguna de que se logren fos resultados deseados. En térmi- 
nos abstractos, los pasos de la innovación son bastante claros: 


€) Proporcionar un programa conereto basado en la investigación y convalidado 
con pruebas. 

b) Empaquetar el programa de modo que esté disponible en buenos libros de 
texto, lecturas complementarias en forma de folletos, películas, programas 
para máquinas de enseñanza, y guías para el profesor. 

c) Ofrecer materiales de prueba para determinar si los objetivos del programa 
se lograron en su totalidad, y acompañar tales pruebas con datos normativos 
adecuados que sirvan de guía durante su aplicación. 

d) Proporcionar entrenamiento al profesor para vencer su resistencia a los 
nuevos métodos y materiales y ganar su aceptación entusiasta del programa 
como algo valioso, así como entrenarlo en el uso del mismo. 

€) Obtener apoyo para el programa por parte de la comunidad, las juntas esco- 
lares, los padres y todas las personas relacionadas con las escuelas. 
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Para citar un ejemplo, la resistencia a la adopción a-gran escala de los métodos 
de enseñanza S/P proviene de los profesores que no quieren realizar el esfuerzo, 
o a los cuales les apasionan las disertaciones, y de los funcionarios molestos por 
las altas calificaciones de los estudiantes SIP. Aunque los resultados de las inves- 
tigaciones son favorables y los estudiantes reconocen sus ventajas, los obstáculos 
surgen: de otros grupos de la comunidad académica. 

No siempre hemos evaluado correctamente nuestras estrategias de innovación. 
A criterio del lego y de las personas no relacionadas con la educación, en ocasio- 
nes nos hemos pasado de la raya; otras veces hemos presentado una gran resis- 
tencia. El comercialismo y los intereses creados intervienen de modo desagrada- 
ble, y desafortunadamente los apoyan ciertas facciones de la propia profesión edu- 
cativa. 

He aquí, entonces, una tarea que exige sabiduría y sensibilidad. Las contri- 
buciones psicológicas pueden provenir más de la psicología social que de la 
psicología del aprendizaje, ya que los procesos implicados son los del control social 
y el cambio de actitudes. Pero a no ser que exista un verdadero interés por las for- 
mas adecuadas de aplicar la innovación, es probable que las escuelas sean víctimas 
de fantasías, en vez de ser herederas de la mejor tradición que podamos estable- 
cer por medio del esfuerzo común. 

Hay sugerencias específicas que es necesario someter a consideración. Por 
ejemplo, sería deseable que cada sistema escolar, de cualquier magnitud, dedicara 
una parte de su edificio, —o por lo menos algunos salones— a la capacitación del 
personal docente en el campo de la innovación; éstos son problemas actuales e im- 
portantes a nivel comunitario que no pueden asignarse a los colegios o universida- 
des especializados en la formación de profesores. Maestros y alumnos podrían pa- 
sar sucesivamente por estos salones para ensayar allí las innovaciones, antes de 
comprometerse a su adopción. De este modo, podrían someterse a prueba unos 
cuantos objetivos de enseñanza mediante la instrucción con ayuda de computado- 
ras o proyectores de televisión de circuito cerrado, sin invertir en ellos lo que 
sería necesario para satisfacer las necesidades de todo un sistema escolar. Los 
profesores tendrían la oportunidad de decidir si aprueban o no los nuevos apara- 
tos, o de seleccionar entre varias posibilidades. No se correría riesgo alguno al es- 
perar, en el caso de que los profesores no estuviesen preparados, ya que es poco 
probable que los métodos que se les impongan tengan éxito si no cuentan con su 
aprobación. Algunas de las innovaciones por comprobar podrían estar a cargo de 
los maestros locales más idóneos, a quienes se les daría la oportunidad de de- 
mostrar a sus colegas lo que hacen en sus propios salones de clases. También 
podría invitarse a los miembros de la junta escolar y a los representantes de los 
padres para que asistieran a esas demostraciones. Los principios del ensayo antes 
de la aceptación y de la elección por parte de quienes han de usar el método, pare- 
cen ser adecuados: si los nuevos métodos son en verdad buenos, gozarán de la 
aprobación general. 

Para construir una conexión firme entre los estudios experimentales del apren- 
dizaje y el salón de clases necesitamos dar una serie de pasos, ya que la ciencia 
aplicada consiste en algo más que en adaptar los principios teóricos a la práctica. 
El punto central es que en las fases de investigación y desarrollo se requiere de 
colaboración entre el psicólogo, el especialista en la materia y el profesor; ade- 
más, deben considerarse cuidadosamente las técnicas de innovación. Si logramos 
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éxito en la integración de estas fases, avanzaremos hacia un mejoramiento de la 
educación que será satisfactorio para todos. 


LECTURAS COMPLEMENTARIAS 


Los libros siguientes son útiles para intentar valorar las teorías de instrucción, tecnología 
e investigación educativa: 


Teorías de instrucción 


Block, J. H. (dir.) Mastesy learning, 2971. 

Brwer, ). S., Toward a theory of instruction, 1966. 

Gagné, R. M., The conditions of learning, 1970. 

Keller, F. S, y Ribes-Inesta, E. (dirs.), Behavior modification: Aplications to education, 
1974. 

Hilgard, E. R. (dir.), Theontes of learning and instrection, 1964a. 

Skinner, B. F., The techaology of teaching, 1968. 
Tecnología educativa 

Atkanson, K. C. y Wilson, H. A. (dirs.), Computer-assisted instruction: A book of readings, 
1969. 

Camegie Commission on Higher Education, The fourth revolution: Instractional technology 
in higher education, 1972. 

Chu, G. C. y Schramm, W., Learning from television: What the search says, 1967. 

Lange, P. C. (dir.), Programea instruction, 1967. 

Levién, R. E., The emerging technology: Instructional uses af the computer in higher educa- 
fos, 1972. 

Suppes, P., Jerman, M. y Brian, D., Computerassisted instruction: Stanford's 1965-66 
arithmetic program, 1968. 

Suppes, P. y Morningstar, M., Computer-assisied instruction at Stanford, 1966-68, 1972. 

Tickton, S. G. (dir.), To tmprove learnirg: An evaluation of instructional technology, 1970. 
Investigación educativa 

Cronbach, L, J, y Suppes, P. (dirs.), Research for tomorrow!'s schools, 1969. 

Gage, N. 1.. (dir.), Handbook of research on teaching, 1963. 

Gagné, R. M. y Gephart, W. L (dirs.), Learning research amd school subjects, 1968. 

Glaser, R. (dir.), Advances ín insirucitonal psycology, vol. 1, 1978. 

Suppes, P. (dir.), Impact of research un education: Some case studies, 1978. 

Wittrock, M. C. (dir.), Learning and instrsction: Readings in educational research, 1977. 
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